Master
Preparado por Guido Pinto Aguirre (actualizado a Abril 2010)
Menú de hoy: 1. Referencia 2. Modelo de regresión clásico y endogeneidad 3. Heterogeneidad no observada 4. Ejemplo en salud 5. Ecuaciones simultaneas
6.
1. Referencia
Socioeconómicos Ambientales
Genéticos Biológicos Comportamiento
Salud
Por ejemplo: Disponibilidad dealimentos Ingreso Educación Dieta Actividad física Estado Nutricional
Cuando los modelos se vuelven complicados, existe la posibilidad que una variable explicativa en una ecuación sea dependiente en otra ecuación.
Estado Nutricional = f (dieta, actividad física) Dieta= f (características individuales)
2. Modelo de regresión clásico y Endogeneidad Y= β0 + β1 X1 + β2 X2 + β3 X3 +… + βk Xk +ε
La heterogeneidad (variabilidad) entre observaciones individuales o sujetos es una condición importante para el funcionamiento apropiado de los modelos estadísticos
La variación de una característica individual dada (variable dependiente) en una población o muestra esta explicada por la heterogeneidad existente un conjunto de características observadas (variables explicativas)
Si losmodelos fueran perfectos, es decir, si todas las variables posibles podrían ser incluidas en el modelo y además si podrían ser medidas sin error; entonces, las variables independientes incluidas podrían explicar toda la variación en la variable dependiente (el coeficiente de correlación múltiple seria 1)
En este caso todas las observaciones estarían sobre la línea de regresión o el hiperplano deregresión
Sin embargo, en la práctica ningún modelo es perfecto.
Variaciones puramente aleatorias (ruido blanco) en el lado de las variables explicativas requiere la incorporación de un componente denominado “término error” a fin de capturar aquella parte de la variación en la variable dependiente que explicada por la heterogeneidad de las variables explicativas
Sea el modelo: Y= β0 +β1 X + β2 Z + ε
Supuestos del modelo sobre el modelo y ε’s son los siguientes: Lineal en los parámetros Y= β0 + β1 X + ε Donde ε es no observable Muestreo aleatorio Se utiliza una muestra aleatoria de la población bajo estudio. Yi= β0 + β1 Xi + εi Donde {(Xi, Yi) i=1,…, n} es una muestra aleatoria de tamaño n Exogeneidad estricta E (εi| xi)= 0, para todo i=1,.., n Entonces la variable x sedenomina exógena; pero si ε y x están correlacionadas, entonces x se denomina variable endógena.
De manera equivalente podemos decir que Cov(εi| xi)= 0 Heterogeneidad de la variable independiente En la muestra, la variable independiente X no es igual a una constante. Esto requiere alguna variación en X en la población, es decir, ∑ (xi – x*) > 0 Donde x* es el promedio de x Homoscedasticidad Var(εi| Xi)= σ, para todo i=1,.., n Multicolinealidad En la muestra (y en consecuencia en la población) no existe una relación lineal perfecta entre las variables explicativas Correlación serial Condicional en X, los errores de dos individuos diferentes o dos periodos diferentes no están correlacionados entre si Corr (εi, εj | xi)=0, para todo i ≠ j Normalidad El error poblacional ε es independientede la variable explicativa x y está distribuido normalmente ε ~ N( 0, σ2)
Si estos supuestos se cumplen, entonces se dice que el modelo es apropiado para los datos disponibles
Una de los supuestos más importantes es el que asume independencia entre ε y las variables explicativas
Pero muchos modelos son más complicados que el presentado arriba. Por ejemplo, podemos considerar el caso enque X & Z están conjuntamente determinadas por otra variable, denominada Q
Esta situación se puede expresar como:
Q β3
β4
Z β2
εZ
X
β1
Y
εY
εX
La variable Y está determinada por el efecto combinado de X & Z, las cuales están a la vez determinadas por Q
Es decir, Q no es parte explicita del modelo: Y= β1 X + β2 Z + εY En consecuencia, la relación implícita...
Regístrate para leer el documento completo.