normalidad
Fortino Vela Peón
Universidad Autónoma Metropolitana
fvela@correo.xoc.uam.mx
20/10/2011
Octubre, 2010
México, D. F.
1
Introducción
Uno de los supuestos básicos del modelo de regresión
lineal clásico es el que los errores tengan distribución
normal, esto es:
y = Xβ + u
yi = β1 + β 2 xi + ui
,o bien,
donde
ui ≈ N (0, σ 2 )
,o bien,
u ≈ N (0, σ 2 I )
Con elcumplimiento del supuesto de normalidad se
tiene la justificación teórica para la utilización de
pruebas estadísticas que involucren a las distribuciones
t, F y χ2 (de uso muy común en la parte inferencial del
modelo).
No obstante, el supuesto de normalidad puede no ser
tan crucial cuando se emplean muestras grandes.
20/10/2011
2
Una propiedad de la distribución normal es que
cualquier función linealde variables normalmente
distribuidas estará también normalmente distribuidas.
Dado que los estimadores de MCO, βˆ1 y βˆ2 , son
funciones lineales de ui entonces también siguen una
distribución normal.
βˆi ≈ N ( β i , σ β2ˆ )
i
De esta manera, si se trabaja con muestras de menos de
100 observaciones resulta crucial el verificar si los
errores cumplen, de manera aproximada, una
distribuciónnormal.
20/10/2011
3
La prueba Jarque-Bera (JB)
La literatura referente a probar la normalidad es vasta
(veáse White y MacDonald, 1980).
La prueba Jarque-Bera (1987) es una prueba que
considera los siguientes elementos para probar la
normalidad de los errores de un modelo de regresión
lineal.
2
[
]
E
u
=
0
donde
E
[
uu'
]
=
σ
y
=
X
β
+
u
Sea
Si u se encuentra normalmente distribuido,
entonces
µ 3= E [u 3 ] = 0
t
µ 4 = E [u 4 ] = 3σ 4
t
20/10/2011
La prueba JB toma este principio: “que tanto se
desvían los coeficientes de asimetría4y curtosis”
Las medidas convencionales de asimetría (A) y curtósis
(K) están dadas, respectivamente*, por:
µ3
µ4
b1 = 3
b2 = 4
σ
σ
La notación b 1 y b 2 es tradicional en estadística y no
debe confundirse con los estimadores del modelo.
b1 = A y
Losmomentos señalados,
b2 = K , se
pueden estimar a partir de los residuales de MCO
considerando que:
1 T i
µˆ i = ∑ ut
T t =1
20/10/2011
donde i=2,3,4
5
Así, el coeficiente de asimetría (A) es el tercer momento
respecto a la media.
Mide el grado de simetría de la distribución de
probabilidad (que tan equilibrada o balanceada se
encuentra).
Si el coeficiente es mayor a cero, la distribución es
sesgada ala derecha, y en consecuencia presenta mayor
número de observaciones a la izquierda.
T
A=
3
u
∑ t n
t =1
2
∑ ut n
t =1
T
20/10/2011
3
…(1)
2
6
Por su parte, el coeficiente de curtosis (K) es el cuarto
momento respecto a la media.
Mide el grado de “picudez” o “apuntamiento” de la
distribución de probabilidad (que tan concentrada se
encuentra).
Cuando el coeficiente es centrado,si esté es diferente a
tres (mesocúrtica), la distribución muestra problemas.
Platicúrtica si b2>3 o leptocúrtica si b2<3.
T
K=
4
u
∑ t n
t =1
2
∑ u t n
t =1
T
…(2)
2
Las formulaciones (1) y (2) son las más utilizadas por los
diferentes paquetes estadísticos.
20/10/2011
7
Bajo la hipótesis nula de que los errores se encuentran
distribuidos normalmente, el estadístico JB sedistribuye
2
χ
asintóticamente como una ( 2 ) , siendo igual a
T
3
∑ ut n
t =1
3
2
T
2
∑ ut
t =1
JB = T
6
20/10/2011
2
2
T
4
u
n
∑
t
t =1
− 3
2
T
2
∑ ut n
+ t =1
24
A 2 (K − 3)2
JB = T +
24
6
8
Note que bajo Ho tanto A como K son cero.
Esteestadístico tiende a ser grande si A o K o ambos
son significativamente diferentes de 0.
20/10/2011
9
Ejemplo
Considerando la información sobre ventas y publicidad de
una empresa determinada, verifique si los residuales
resultantes del modelo siguen aproximadamente una
distribución normal. Aplique la prueba Jarque-Bera.
id
1
2
3
4
5
6
7
8
9
10
11
12
20/10/2011
Total
Y
69
76
52
56
57
77
58
55
67
53...
Regístrate para leer el documento completo.