Anovas
ANÁLISIS DE LA VARIANZA
ANOVA: Tipología de modelos
Factores Información
Efectos
Modelo
1
Completamente aleatorizada
Fijos
M1
1
Completamente aleatorizada
Aleatorios
M2
1
Aleatorizada en bloques
Fijos
M3
1
Aleatorizada en bloques
Aleatorios
M4
2
Completamente aleatorizada
Fijos
M5
2
Completamente aleatorizadaAleatorios
M6
2
Aleatorizada en bloques
Fijos
M7
2
Aleatorizada en bloques
Aleatorios
M8
Pablo Alonso González
Hipótesis básicas del ANOVA
•
Se parte de k poblaciones, representadas por variables aleatorias
independientes, X1, X2,...,Xk
•
Hipótesis básicas:
Las variables X1, X2,...,Xk son independientes
Xi ≈ N(μi, σ) ∀i = 1,2,...,k
Todas lasvariables deben tener la misma varianza (homocedasticidad)
Muestreo aleatorio simple dentro de cada nivel
Pablo Alonso González
MODELOS M1 Y M2
Pablo Alonso González
Expresión fundamental de la varianza
ST = SCD + SCE
k ni
(
SCD = S E = ∑ ∑ xij − xi⋅
i =1 j =1
k ni
)
2
k
SCE = S A = ∑ ∑ ( xi⋅ − x ) = ∑ ni ( xi⋅ − x )
2
i =1 j =1
k ni
i =1
(
⇒ ST = SE + S A = ∑ ∑ xij − xi⋅
i =1 j =1
2
)
2
k
+ ∑ ni ( xi⋅ − x )
2
i =1
Pablo Alonso González
M1: Fundamentos
•
Planteamiento:
se tiene una variable aleatoria cuantitativa, ξ, cuyo valor está determinado
por un factor como variable aleatoria cualitativa, del cual hay k posibles
niveles, F1, F2,..., Fk
•
Modelo de partida e hipótesis a contrastar:
xi = μi +εi / εi ≈ N ( 0 ,σ )
H 0 : μ1 =
= μk = μ
H1 : ∃μi ≠ μ j
o, alternativamente:
xi = μ + αi + εi / εi ≈ N ( 0 ,σ )
H 0 : α1 =
= αk = 0
H1 : ∃αi ≠ 0
Pablo Alonso González
M1: presentación de la información
1
2
...
...
n
F1
n11
n12
...
...
n1n
F2
n21
n22
...
...
n2n
...
...
...
...
...
...
...
......
...
...
...
Fk
nk1
nk2
...
...
nkn
el tamaño
muestral de
cada factor no
tiene porqué
ser igual
filas = factores
columnas = observaciones
Pablo Alonso González
M1: cálculo abreviado
• SA:
(
i =1
k
)
k
2
E ( S A ) = ( k − 1) σ + n ∑ μi − μ 2
i =1
si H 0 cierta ⇒ E ( S A ) = ( k − 1) σ2
2
S A = ∑ ni xi2 − Nx 2 / N = kn
⋅• SE:
k
n
k
2
S E = ∑ ∑ xij −∑ ni xi2
⋅
i =1 j =1
i =1
• ST:
k
n
ST = ∑ ∑
i =1 j =1
E ( S E ) = ( N − k ) σ2 en cualquier caso
2
xij −Nx 2
(
i =1
k
)
2
E ( ST ) = ( k − 1) σ + n ∑ μi − μ 2 + ( N − k ) σ 2
2
si H 0 cierta ⇒ E ( ST ) = ( N − 1) σ2
Pablo Alonso González
M1: cuadrados medios
Cuadrados medios =
• S’A:
Suma decuadrados
grados de libertad
S
S′ = A
A k −1
(
i =1
nk 2
μi − μ 2
E ( S′ ) = σ +
A
k −1 ∑
2
)
si H 0 cierta ⇒ E ( S ′ ) = σ2
A
• S’E:
S
′
SE = E
N −k
• S’T:
′
E ( S E ) = σ2 en cualquier caso
ST
N −1
(
i =1
nk2
′
μi − μ 2
E ( ST ) = σ +
N −1 ∑
2
)
′
si H 0 cierta ⇒ E ( ST ) = σ2
Pablo Alonso González
M1: contraste a realizar y formulación•
Contraste a realizar y ley estadística:
E ( S ′ ) ⎧1 si H 0 cierta
A
=
′ ) ⎨> 1 si H 0 no cierta
E ( SE
⎩
•
S′
A ≈F
k −1,N − k si H 0 cierta
′
SE
Formulación del contraste:
S′
A > F ( α ) ⇒ se rechaza H
0
′
SE
S′
si A ≤ F ( α ) ⇒ no se rechaza H0
′
SE
si
Pablo Alonso González
M1: tabla ANOVA
Fuente
Suma de grados de Cuadrados
F
cuadradoslibertad
medios
empírica
Variación
entre
factores
SA
Variación
dentro
del factor
SE
k-1
N-k
F
teórica
S’A
S’E
S′
F= A
′
SE
F*k-1,N-k
Pablo Alonso González
M1: actuación cuando se rechaza H0
•
Se comparan dos a dos las medias
•
Casos posibles:
⎛ k ⎞ k ( k − 1)
=m
⎜ 2⎟ =
2
⎝⎠
•
Regla de decisión:
si xi i - x j i > tα* ( N - k )...
Regístrate para leer el documento completo.