econometria
a
Se ha visto anteriormente que la correlaci´n
o
entre dos variables puede ser alta a pesar de
que la relaci´n entre las dos sea fuertemente
o
no lineal.
Se pueden utilizar los residuos para ver si el
modelo de regresi´n lineal es adecuado.
o
Casi siempre es ´til hacer gr´ficos de los residu
a
uos (frente x, y o y ) para ver si los supuestos
ˆ
del modelolineal de regresi´n son justificados
o
o no.
Ejemplo 83 La recta de regresi´n para los cino
co siguientes conjuntos de datos es la misma:
y = 18,43 + 0,28 ∗ x
Bassett, E. et al (1986). Statistics: Problems and Solutions. London: Edward Arnold
169
22
22
21
y
23
23
y
24
21
20
20
19
19
18
18
17
4
6
8
10
12
14
4
6
8
x10
12
14
10
12
14
x
27
24
23
25
y
21
21
20
19
19
4
6
8
10
12
14
4
x
6
8
x
24
23
22
y
y
22
23
21
20
19
18
8
10
12
14
16
18
20
x
170
El primer caso parece una regresi´n noro
mal.
En el segundo caso, hay una relaci´n no
o
lineal.
En el tercer gr´fico, se ve la influencia dea
un dato at´
ıpico.
En el cuarto gr´fico parece que la recta
a
est´ m´s cerca a los datos cuando x es
a
a
m´s peque˜o.
a
n
En el ultimo caso, se ve el efecto de un
´
punto influyente.
Ahora hacemos gr´ficos de los residuos frente
a
a las predicciones.
171
Gráfico de predicciones frente a residuos
Gráfico de predicciones frente a residuos
2
residuos
residuos
21
0
-1
1
0
-1
-2
-2
19
20
21
22
23
19
20
yhat
Gráfico de predicciones frente a residuos
22
23
Gráfico de predicciones frente a residuos
2,5
residuos
4,7
2,7
0,7
1,5
0,5
-0,5
-1,3
-1,5
-3,3
19
-2,5
20
21
22
23
19
yhat
20
21
22
yhat
Gráfico de predicciones frente a residuos
2residuos
residuos
21
yhat
1
0
-1
-2
20
21
22
23
24
yhat
172
23
En el primer caso, los residuos parecen aleatorios. Es una buena indicaci´n que el modelo
o
de regresi´n se ajusta bien.
o
En el segundo caso, se ve una relaci´n eno
tre y y los residuos. El modelo lineal no se
ˆ
ajusta bien.
Cuando haya un dato at´
ıpico, se ve un residuo muyalto.
Los residuos son m´s peque˜os cuando y
a
n
ˆ
es peque˜o.
n
Se ve el efecto del dato influyente.
173
Dos rectas de regresi´n
o
Hasta ahora, hemos pensado en un modelo
y = α + βx +
y dada la muestra, hemos usado m´
ınimos cuadrados para ajustar la rectas
y = a + bx
s
¯
x
con b = sxy y a = y − b¯.
2
x
Podr´
ıamos escribir el modelo de otra manera:
x = γ + δy + ν
1donde δ = β , γ = − α y ν = − β .
β
No obstante, si usamos m´
ınimos cuadrados para
ajustar la recta x = c + dy a los datos muestrales tendr´mos
e
sxy
y c = x − d¯.
¯
y
d= 2
sy
Observamos que d = 1 . ¡Las rectas no son
b
iguales!
174
Ejemplo 84 Volvemos al Ejemplo 72 sobre extensi´n (y) relativa a la fuerza (x) aplicada al
o
muelle.
Antes hemos visto que ajustando larecta y =
a + bx por m´
ınimos cuadrados, se tiene
y = 2,9 + 117x.
Ahora supongamos que queremos predecir la
fuerza x que causar´ una extensi´n de y. Ajuıa
o
stando la recta por m´
ınimos cuadrados, tenemos
x = ,0139 + ,0075y.
El ajuste de ambas rectas aparece en el siguiente gr´fico.
a
175
70
60
y
50
40
30
y=a+bx
x=c+dy
datos
20
10
0.05
0.1
0.15
0.20.25
0.3
x
0.35
0.4
0.45
0.5
0.55
Para hacer regresi´n es importante saber cuales
o
son las variables dependientes y independientes.
176
Correlaci´n espuria
o
Si el coeficiente de correlaci´n entre dos vario
ables es alta, indica que est´n relacionadas ena
tre si. No obstante, no permite concluir una
relaci´n causal.
o
Ejemplo 85 Se ha descubierto que por...
Regístrate para leer el documento completo.