Tarea
CP 2010 Gustavo Ramírez Valverde
El modelo de regresión
Cada valor de X conforma una población respecto a los valores de Y. Población con individuos con X = x1
Sin perder generalidad, podríamos pensar Y son los gastos de consumo personales y X son los ingresos.
El modelo de regresión lineal consiste en suponer que las medias de las poblaciones para cadavalor de “X” forma una línea recta:
E Y / X =μ Y / X = β 0 β 1 X
0
El modelo de regresión lineal es:
y i =μ Y / X ε i = β 0 β 1 X i ε i
0
El modelo verdadero no se conoce (no se conoce la población). Solo se tiene una muestra (los puntos rojos en la gráfica) y se requiere estimar los parámetros
β 0 y β1
Estimador de mínimos cuadrados ordinarios (MCO)
Y
• Los estimadoresde mínimos cuadrados ordinarios, son aquellos valores de los parámetros que minimizan en promedio los residuos al cuadrado
e= yi− i y
Resido = Y observada- Y estimada
n 2 i=1
n 2 i=1
min ∑ y i − y i = min ∑ y i − β 0 − β 1 x
Propiedades de los estimadores de mínimos cuadrados
• Son insesgados • Son Meli bajo los supuestos básicos • Coincide con los estimadores demáxima verosimilitud • Tienen distribución normal bajo los supuestos básicos
Supuestos de modelo de regresión lineal
• Para hacer correctas inferencias con el modelo, se requiera se cumplan los Supuestos:
• • • • INDEPENDENCIA DE LAS OBSERVACIONES (MUESTRA ALEATORIA). HOMOGENEIDAD DE VARIANZAS. NORMALIDAD. LAS VARIABLES EXPLICATORIAS SON FIJAS
INTERVALOS DE CONFIANZA
• Bajo los supuestosdel modelo de regresión
y i =β 0 β1 x iε i
β0 N β0 ,
ε i ∼NIID 0, σ i
2
∼
n
∑
i =1 n i =1
x2 σ 2 i
2
n ∑ x−x
∼
β1 N β1 ,
σ
n i=1
2 2
∑ x −x
INTERVALOS DE CONFIANZA
• Entonces:
β 0 ± t α / 2 , n− k S β
0
y β 1± t α / 2, n−k S β1
• Son un intervalo de confianza del 1-α (100)% para βo y β1 • Con
Sβ = 0
x σ2 ∑
i=1 n 2 i
n
n ∑ x− x
i =1
2
Sβ
i1
=
n
∑
i=1 n
σ2
2
∑ x i−x i=1
σ 2=
n
∑ y i − y
i=1
2
n−k
PRUEBA DE HIPOTESIS
• PARA PROBAR: • Ho: βi = 0 • Ha: βi ≠ 0. • Entonces calcular:
β i −β i t= Sβ
i
t n−k
βi tc= S β
i
• Rechazo Ho si
t c ≥ t α/ 2, n−k
EJEMPLO:
• UNA CIERTACOMPAÑÍA PRODUCE LOTES MENSUALES DE TAMAÑO FLUCTUANDO CON LA DEMANDA RELACIONA TAMAÑO DE LOTE Y HORASHOMBRE
X 30 20 60 80 40 50 60 30 70 60
Y 73 50 128 170 87 108 135 69 148 132
Los datos pueden ser importados de Excel
Paquete Gretel con los datos
MCO en GRETL
INTERVALOS DE CONFIANZA
PRUEBA DE HIPOTESIS
• PARA PROBAR: • Ho: β0 = 0 • Ha: β0 ≠ 0.
β 0 10 tc= = =3 .995302 S 2 .502939 β
0
t c ≥ t α/ 2, n−k
Entonces rechazo Ho.
PRUEBA DE HIPOTESIS
• PARA PROBAR: • Ho: β1 = 0 • Ha: β1 ≠ 0.
β0 2 tc= = =42 . 58352 S 0 . 046967 β
0
t c ≥ t α/ 2, n−k
entonces rechazo Ho.
INTERVALOS DE CONFIANZA Y PRUEBA DE HIPOTESIS EN GRETL
EL COFICIENTE DE DETERMINACION COMO MEDIDA DE AJUSTE DEL MODELO
Y i − Y = Y i − Y Y−Y
ERROR
TOTAL
MODELO
∑ Y i − Y
SUMA DE CUADRADOS TOTAL
2
=
Y i − Y ∑
SUMA DE CUADRADOS DELERROR
2
Y − Y ∑
SUMA DE CUADRADOS DELMODELO
2
EL COFICIENTE DE DETERMINACION COMO MEDIDA DE AJUSTE DEL MODELO
Predicción
Y
X
Se desea predecir el valor Y para un valor dado de X
Predicción de nuevas observaciones
Se desea predecirobservaciones futuras de Yo para un valor Xo
= β β X Y0 0 1 0
El intervalo de predicción se calcula con:
0 ±t y
α 2
n−2,
1 2 1 x 0 − / SXX σ 2 x n
n
SXX=∑ X i− X 2
i=1
Intervalo de confianza para la respuesta media
μ y/ x = β0 β1 X 0
0
Intervalo
μ y / x ±t
0
n−2,
α 2
2 1 2 x 0− /SXX σ x n
...
Regístrate para leer el documento completo.