REGRESIÓN LINEAL MÚLTIPLE
Tabla anova
FUENTE DE VARIACIÓN
SS
GL
MS
Cuando se contradice el resultado de los betas en el summary y los resultados del anova es un indicio deproblemas de multicolinealidad
Summary= significancia de los betas
Anova: aporte de la variabilidad de y
Ho: Bi= vs Ha: Bi=/ 0
Ho: MSRxi=MSE vs Ha: MSRxi>MSE
Para detectar los problemasde multicolinealidad se usa los factores de inflación de varianza (VIF) se calcula para cada una de las variables en el modelo, la idea es que el VIF se calcula con base al R^2 de cada una de lasvariables en función del resto.
Suponiendo que se tienen Xp variables independientes todas ellas no están correlacionadas
1. X1= βo+ β1X1+ β2X3+…+ βpXp+e
R^2ª(x1)0 si x1, x2, x3,…, xp sonindependientes
R^2ª(x1)1 si x1, x2, x3,…, xp están correlacionadas
2. X1= βo+ β1X1+ β2X3+…+ βp-1Xp-1+e
R^2ª (xp)0 si x1, x2, x3,…, xp son independientes
R^2ª (xp)1 si x1, x2, x3,…, xp estáncorrelacionadas
El VIF para la K -esima variable independiente se calcula como
VIFk= 1/ 1- R^2ª (xp)
Si R^2ª (Xk)0, es decir, son independientes, VIFk1, es decir no hay problemas demulticolinealidad
Si R^2ª (Xk)1, es decir, son independientes, VIFk∞, es decir hay problemas de multicolinealidad
Un punto de corte para identificar este tipo de problemas será VIFk>3
MODELOFULL: modelo con todas las variables independientes
Variables con problemas de multicolinealidad: GF, PJ, PG, PP, GC
SE CONSTRUYEN INDICADORES
GF/PG:
GC/PP:
GF-GC: goles de ventaja
GF/GC:#goles a favor por cada gol en contra que tiene (razón)
PP/PG: # de partidos perdidos por cada partido ganado
¿CUAL VARIABLE APORTA MÁS A LA VARIABILIDAD DEL MODELO?
Como todas las variablesestán medidas en unidades diferentes es necesario estandarizarlas con el fin de saber cual tiene mayor efecto sobre Y
El modelo final con las variables estandarizadas seria
Y la variable con...
Regístrate para leer el documento completo.