ANOVA
a
• T´cnica de dependencia.
e
• Objetivo: detectar el efecto de ciertas variables explicativas de tipo cualitativo (FACTORES) sobre una o varias variables dependientes cuantitativas (RESPUESTA).
Ejemplo tipo:
Para analizar el posible efecto del tipo de fertilizante (A,B,C) sobre cierto cultivo se hicieron
pruebas sobre 72 parcelas y se recogi´ informaci´n sobrela cosecha (rendimientos en Kg).
o
o
Parcela
Tipo de fertilizante
1
A
2
.
.
.
.
.
.
A
72
B
C
.
.
.
Se quiere saber si el rendimiento medio es el mismo en las parcelas fertilizadas con A,B,C.
Factor: Fertilizante.
Respuesta: Kg de cosecha.
Podemos pensar que las parcelas no son id´nticas y decidimos controlar el distinto grado
e
de humedad en cada parcela,considerando 4 niveles de humedad.
1
En este caso la variable respuesta sigue siendo el rendimiento (Kg de cosecha) y los factores:
el fertilizante (A,B,C) y el nivel de humedad (1,2,3,4).
A
B
C
Humedad 1
Humedad 2
Humedad 3
Humedad 4
La hip´tesis que contrastamos en el an´lisis de la varianza es una hip´tesis de
o
a
o
igualdad de medias; pero el procedimiento se basa enla descomposici´n de la vario
anza.
2
An´lisis de la varianza con 1 factor.
a
Modelo matem´tico.
a
Tenemos una v.a. X observada en los distintos niveles de una variable cualitativa o factor.
La distribuci´n de X es:
o
• en la modalidad 1 con n1 observaciones X1 ∼ N (µ1 , σ 2 )
• en la modalidad 2 con n2 observaciones X2 ∼ N (µ2 , σ 2 )
.
• .
.
.
.
.
.
.
.
.
.
..
.
.
• en la modalidad k con nk observaciones Xk ∼ N (µk , σ 2 )
Datos:
1
2
i
k
X11
X12
X1i
X1k
X21
.
.
.
.
.
.
X22
.
.
.
.
.
.
X2i
X2k
Xji
.
.
.
Xjk
.
.
.
Xn1 1
Xn2 2
Xni i
Xnj k
¯
X.1
¯
X.2
¯
X.i
¯
X.k
Tratamos de contrastar la hip´tesis:
o
Ho: µ1 = µ2 = · · · = µk
n=
¯
X.i =
k
i=1 nini
j=1
Xji
ni
3
ni
j=1
¯
X=
k
i=1
Xji
n
¯
¯
¯
¯
Xji − X = (Xji − X.i ) + (X.i − X)
k
i=1
ni
j=1 (Xji
¯
− X)2 =
k
i=1
ni
j=1 (Xji
¯
− X.i )2 +
k
i=1
ni
¯
j=1 (X.i
¯
− X)2
SST = SSW + SSB
SCT = SCD + SCE
Suma Cuadrados Total= Suma Cuadrados Dentro de Grupos+Suma Cuadrados Entre Grupos.
Cuanto mayor sea
SCT
σ2
=SCD
σ2
+
SCE
SCD
m´s tendencia habr´ a rechazar la igualdad de medias.
a
a
SCE
σ2
χ2 = χ2 + χ2
n−1
n−k
k−1
SCE/k−1
SCD/n−k
=
χ2 /k−1
k−1
χ2 /n−k
n−k
∼ Fk−1,n−k
Cuanto menor sea el cociente, m´s veros´
a
ımil es la hip´tesis de igualdad de medias.
o
4
Tabla de ANOVA.
Variaci´n
o
g.l.
Suma cuadrados
Cuadrados Medios
F
Entregrupos
k-1
SCE
SCE/k − 1
SCE/k−1
SCD/n−k
Dentro grupos
n-k
SCD
SCD/n − k
Total
n-1
SCT
Una vez que hemos rechazado la igualdad de medias, nos preguntamos si todas las medias
son distintas entre si o si es posible aceptar hip´tesis parciales.
o
Contrastes tipo Scheff´.
e
Ho: L =
k
i=1 Ci µi
= 0 con
k
i=1 Ci
=0
Ello nos permite contrastarhip´tesis del tipo:
o
Ho: µi = µj
Ho: µi =
µj +µk
2
Para ello construimos
ˆ
¯
¯
¯
L = C1 X.1 + C2 X.2 + · · · + Ck X.k
2
¯
Como cada X.i ∼ N (µi , σ i )
n
ˆ
E(L) = C1 µ1 + C2 µ2 + · · · + Ck µk
2 σ2
2 σ2
2 σ2
ˆ
V ar(L) = C1 n1 + C2 n2 + · · · + Ck nk
5
Como σ 2 es desconocido se aproxima por
SCD
n−k
Se puede comprobar que el I.C. para L es:
ˆ
L+
−
(k− 1)Fk−1,n−k
SCD
n−k
2
Ci
k
i=1 ( ni )
Si 0 ∈I.C. Aceptamos la Hip´tesis nula: L = 0,
o
Si 0 ∈I.C. Rechazamos la Hip´tesis nula:
/
o
Ci µi = 0
Ci µi = 0
6
An´lisis de la varianza con 2 factores.
a
• Una observaci´n por casilla.
o
Factor A→ k niveles.
Factor B→ k’ niveles.
n´mero de observaciones n = kk
u
A
2
···
i
···
k
1
X11
X12...
Regístrate para leer el documento completo.