Econometria
Regresión y correlación
Contenidos:
!
✓
✓
✓
✓
Dependencia funcional o exacta y dependencia estadística
Concepto de regresión
Método de mínimos cuadrados
Análisis de la bondad de ajuste. Error cuadrático medio, varianza residual
y coeficiente de determinación lineal
Estadística Económica
2007-2008. Sara Mateo.
Independencia - Dependencia
Cuando se estudiandos características simultáneamente sobre una muestra, se
puede considerar que una de ellas influye sobre la otra de alguna manera. Por
ejemplo la altura y el peso o las horas de estudio y la calificación en un examen.
!
El objetivo principal de la regresión es descubrir el modo en que se relacionan.
!
Dos variables pueden considerarse:
!
•
•
•
Variables independientes ! Notienen relación (una de ellas no sirve para
explicar los movimientos de la otra)
Dependencia funcional ! Y=f(x)
Dependencia estadística
!
Independencia estadística
-
Dependencia
estadística
Dependencia funcional
Grado de asociación entre dos variables
+
GRÁFICOS DE DISPERSIÓN: Permite ver si hay asociación
Dadas dos variables X y Y tomadas sobre el mismo elemento de lapoblación, el diagrama de dispersión es simplemente un gráfico de
dos dimensiones, donde en un eje (la abscisa) se sitúa una variable,
y en el otro eje (la ordenada) se sitúa la otra variable. Si las
variables están correlacionadas, el gráfico mostraría algún nivel de
correlación (tendencia) entre las dos variables. Si no hay ninguna
correlación, el gráfico presentaría una figura sin forma,una nube de
puntos dispersos en el gráfico.
Asociación
positiva. Si
aumenta X
aumenta Y
Estadística Económica
2007-2008. Sara Mateo.
GRÁFICOS DE DISPERSIÓN / RECTA DE REGRESIÓN
La relación entre dos variables métricas puede ser
representada mediante la línea de mejor ajuste a los datos.
Esta recta se le denomina recta de regresión, que puede ser
negativa o positiva, la primera contendencia decreciente y la
segunda creciente.
GRÁFICOS DE DISPERSIÓN / RECTA DE REGRESIÓN
Para el cálculo de la recta de regresión se aplica el método de
mínimos cuadrados entre dos variables. Esta línea es la que
hace mínima la suma de los cuadrados de los residuos, es
decir, es aquella recta en la que las diferencias elevadas al
cuadrado entre los valores calculados por la ecuación dela
recta y los valores reales de la serie, son las menores posibles.
y = a + bx
Recta de regresión
Pendiente
yn
ˆ
yi
yn −1
y3
u3
yi
y1
ui
yi
y2
Intercepto
x1
x2
x3
yi = a + bxi + ui
xi
xn −1
xn
ˆ
ui = yi − yi
Error
Llamemos a “u” perturbación o error, siendo la diferencia que hay entre el
valor observado de la variableexógena (y) y el valor estimado que
ˆ
obtendremos a través de la recta de regresión yi .
∧
y i = a + bxi
La metodología para la obtención de la recta será hacer MÍNIMA la suma de
los CUADRADOS de las perturbaciones. ¿Por qué se elevan al cuadrado?
n
2
i
ˆ
u = ( yi − yi ) 2
ui2 =
∑
i =1
n
ˆ
( yi − yi ) 2
∑
i =1
n
2"
! n 2 n
2
ˆ
a p %
min &∑ ui = ∑ ( yi − yi ) = ∑! yi − (q +b xi )" '
$
q, p
i =1
i =1
$ i =1
%
Estadística Económica
2007-2008. Sara Mateo.
En el modelo de regresión lineal simple la función elegida para aproximar la relación entre las
variables es una recta, es decir y=a+bx, donde a,b son los parámetros. A esta recta la
llamaremos RECTA DE REGRESIÓN DE Y SOBRE X.
!
Vamos a deducir su ecuación usando el método de los mínimoscuadrados. Dado un valor de
X, tenemos los dos valores de Y, el observado, yi , y el teórico, yi* = a + bxi. Hemos de
minimizar los errores cometidos:
n
Ψ=
n
2
MINIMIZAR
2
∑ (y −(a +bx )) =∑ (y −a −bx )
i
i =1
Errores cometidos al
aproximar por una recta
i
i
i
i =1
El valor que hemos
aproximado para “y” con la
recta de regresión ! y*
− na = −...
Regístrate para leer el documento completo.