Estadistica 2
Unidad 1
1.1 Regresión lineal simple y múltiple
Regresión
A menudo deseamos estimar, basados en datos de una muestra, el valor de una variable Y correspondiente a un valor dado de la variable X. Ello se puede hacer estimando el valor de Y mediante una curva de mínimos cuadrados que ajuste los datos. La curva resultante se llama una curva de regresión de Y sobre X, ya queY se estima a partir de X.
Si queremos estimar el valor de X a partir de un valor dado de Y, hemos de usar una curva de regresión de X sobre Y, que viene a ser un intercambio de las variables en el diagrama de dispersión de modo que X sea la variable dependiente e Y la independiente. Eso equivale a sustituir las desviaciones verticales en la definición de la curva de mínimos cuadrados pordesviaciones horizontales.
En general, la recta o curva de regresión de Y sobre X no es la misma que la de X sobre Y.
1.2 El modelo de regresión lineal simple.
Los Modelos de Regresión estudian la relación estocástica cuantitativa entre una variable de interés y un conjunto de variables explicativas. Estos modelos son muy utilizados y su estudio conforma un área de investigación clásica dentro dela disciplina de la Estadística desde hace muchos años.
Cuando se estudia la relación entre una variable de interés, variable respuesta o variable dependiente [pic]y un conjunto de variables regresoras (explicativas, independientes) [pic], puede darse las siguientes situaciones:
1) Existe una relación funcional entre ellas, en el sentido de que el conocimiento de las variables regresorasdetermina completamente el valor que toma la variable respuesta, ésto es,
[pic]
2) No exista ninguna relación entre la variable respuesta y las variables regresoras, en el sentido de que el conocimiento de éstas no proporciona ninguna información sobre el comportamiento de la otra. Ejemplo: la relación que existe entre el dinero (Y ) que gana una persona adulta mensualmente y su altura (X).
3)El caso intermedio, existe una relación estocástica entre la variable respuesta y las variables regresoras, en el sentido de que el conocimiento de éstas permiten predecir con mayor o menor exactitud el valor de la variable respuesta. Por tanto siguen un modelo de la forma,
[pic]
siendo m la función de regresión desconocida y [pic]una variable aleatoria de media cero (el error de observación).Las relaciones estocásticas son las que ocurren en la mayoría de las situaciones y su estudio se corresponde con los denominados Modelos de Regresión.
El objetivo básico en el estudio de un modelo de regresión es el de estimar la función de regresión, m, y el modelo probabilística que sigue el error aleatorio [pic], esto es, estimar la función de distribución F[pic] de la variable deerror. La estimación de ambas funciones se hace a partir del conocimiento de una muestra de las variables en estudio, [pic].
Una vez estimadas estas funciones se tiene conocimiento de:
La relación funcional de la variable respuesta con las variables regresoras, dada por la función de regresión que se define como sigue,
[pic]
Esto permite tener una idea general del comportamiento de lavariable respuesta en función de las regresoras.
Se puede estimar y predecir el valor de la variable respuesta de un individuo del que se conocen los valores de las variables regresoras. Ésto es, de un individuo t se sabe que X1 = x1,t,...,Xk = xk,t, entonces se puede predecir el valor de Y t y calcular un intervalo de predicción del mismo.
1.3 Los modelos de regresión se pueden clasificar dedos formas:
Según la metodología utilizada para su estudio:
1. Modelos de regresión paramétricos. Se supone que la función de regresión, m, que relaciona a la variable respuesta con las variables regresoras pertenece una determinada familia paramétrica:
[pic]
donde [pic]= [pic]y [pic]= [pic][pic][pic]p [pic]Rp.
Por ejemplo, se supone que la familia paramétrica es...
Regístrate para leer el documento completo.