Econometria - Analisis De La Varianza Con Un Atribut
i Promedio del subcolectivo i2 Varianza del subcolectivo
En cada subcolectivo se tomará, una muestra, no necesariamente del mismo tamaño. Las muestras serán independientes. Con los datos de cada muestra podemos hallar la media y la varianzamuestrales. ni tamaño muestral tomada en el subcolectivo “i” media de la muestra extraída en el subcolectivo “i” Varianza muestral de la muestra extraída en el subcolectivo “i” Tamaño de la muestra total La media de todas los datos de todas las muestras (media muestral
yi
S`i2 n.
y.
general) S.’2
La Varianza muestral de todas los datos de todas las muestras .
Tabla de datos muestrales
Subc1 2 …. m Tamaño muestral n1 n2 … nm n. Datos muestrales y11,y12…y1n1 y11,y12…y1n1 … ym1,ym2…ynm Media Muestral
y1
y2
…
Varianza muestral S’12 S’12 … S’2m S’2
ym
y
MODELO: En general yi DN ,
No obstante, la existencia de “m” subcolectivos provoca que yi DNi, i El modelo por tanto está compuesto de n ecuaciones, una para cada individuo de la muestra de nindividuos y m subcolectivos, de tal forma que para cada individuo tenemos que yij i ij El valor observable de cada individuo se descompone en dos partes, el promedio del subcolectivo al que pertenece y una perturbación aleatoria que recogen el efecto sobre la variable de otras variables distintas al atributo y no tenidas en cuenta en el modelo.
HIPOTESIS SOBRE LAS PERTURBACIONESALEATORIAS 1- PROMEDIO “0”: LA esperanza matemática de las perturbaciones es 0 E(i)=0 Consecuencia: E (εij)= E[(μi-εi)=E[µi]=µi 2- . Hipótesis de Homoscedasticidad la varianza de todas las perturbaciones es igual. Designamos 2 Varianza común. Var ( ij )
Consecuencia de esta hipótesis: Como Var (εij) = Var (Yij), entonces estamos suponiendo que en todos los subcolectivos la variable objeto deestudio tiene la misma variabilidad entorno a la media. 3- Hipótesis de NO Autocorrelacion. Consiste en suponer que la covarianza entre 2 perturbaciones distintas es 0. Cov (εij, εkl)= 0 Entre dos perturbaciones distintas no hay correlación. 4- Hipótesis de normalidad. Consiste en suponer que todas las perturbaciones tienen distribución normal.
ij DN 0n , 2
Resolución del Modelomediante analisis de la varianza CONTRASTE IGUALDAD DE MEDIAS
Ho : 1 2 ... m Ha : i
Ho indica que el atributo no influye sobre la variable cuantitativa Y
Si sale RHo Afirmaremos que el atributo influye significativamente sobre la variable Y El método Anova sirve para realizar este contraste.
(copiar aquí la figura 3.3 de la página 50 del libro)
DESCOMPOSICIÓN DE LAVARIANZA
Yij y yij yi ( yi y)
Elevamos al cuadrado los 2 miembros de la igualdad anterior:
Yij y Yij yi y y
2 2
2
2 yij yi yi y
m ni
Sumamos para todos los individuos de todos los subcolectivos:
yij y yij yi yi y
m ni 2 m ni 2 m ni i 1 j 1 i 1 j 1 i 1 j 1
m m m
2
2 yij y yi y
i 1 j 1
nS 2 niSi 2 ni( yi y) 2 O (n 1) S ' 2 (ni 1) S ' i 2 ni( yi y) 2
i 1 i 1 i 1 i 1
m
SCT = SCR
+ SCE
SCT = SCR
+ SCE
Se puede demostrar que Cuando se cumple la hipótesis nula del modelo:
SCR ˆ 2 nm
SCE
Y que
2
2 m 1
SCR
2
2 nm
Con lo que podemos construir el...
Regístrate para leer el documento completo.