ANALISI DE REGRESI N Y CORRELACI N
INTRODUCCIÓN.
En muchos casos nuestro interés se centra en la relación que hay entre dos o más variables cuantitativas, es decir no interesa conocer el efecto que una o más variables (predictoras o independientes) pueden causar en otra variable (Respuesta o dependiente), incluso nos interesa predecir valores de una variable a consecuencia de otra u otrasvariables.
Por ejemplo quisiéramos saber si las ventas de jugos se relaciona con la temperatura, en este caso la lógica nos dice que a mayor temperaturas las ventas de jugos debería ser mayores.
El análisis de regresión estudia la dependencia que hay entre una variable respuesta o dependiente (Y) y una o más variables independientes (X). El análisis de regresión puede ser múltiple o simple.REGRESIÓN LINEAL SIMPLE.
La regresión lineal simple estudia la dependencia lineal que hay entre una variable Independiente o predictora (X) y una variable dependiente o respuesta (Y), el modelo matemático se expresa de la siguiente manera:
Donde
son los parámetros que reciben el nombre de coeficientes de regresión
es la ordenada n el origen que representa el valor de Y cuando x=0
: es lapendiente de la recta, representa el incremento de Y para un incremento unitario de x.
, perturbación o error aleatorio, que se asume normal con N(0,)
Y, es la variable aleatoria dependiente
El modelo supone que la variable dependiente Y, es influida por todas las causas agrupadas en dos grupos de factores, un primer factor contiene una variable independiente x y el segundo, compuesto por una serie defactores aleatorios no controlados ,
Ejemplo en el consumo de jugos influye la temperatura como primer factor y otros factores no controlados como (gustos, costumbres, etc.) que se representaría como .
Dado que suponemos que la media y la varianza de es 0 y entonces se tiene
De la expresión se puede deducir lo siguiente:
La media de Y, para un valor fijo x, varía linealmente con x.
Para unvalor x se predice un valor en Y dado por , por lo que el modelo de predicción puede expresarse también como
Los parámetros son desconocidos y habrá que estimarlos para realizar predicciones por medio de datos muestrales.
Supuestos del modelo de regresión lineal
En la población, la relación entre las variables X e Y debe ser aproximadamente lineal,
, siendo e la v.a. que representa losresiduos(diferencias entre el valor estimado por el modelo y el verdadero valor de Y ).
Los residuos se distribuyen según una Normal de media 0,
Los residuos son independientes unos de otros.
Los residuos tienen varianza s2 constante.
ESTIMACIÓN DE LOS PARÁMETROS
Si queremos estimar valores desegún el modelo debemos determinar de entre cientos de ecuaciones la recta que más se ajuste a losdatos (Ajuste de mínimos cuadrados) o sea la recta que tenga el mínimo error
De despejamos y elevamos al cuadrado
Para determinar un mínimo se debe derivar respecto a
Luego de derivar se obtiene las ecuaciones normales:
Donde, se obtiene los estimadores de mínimos cuadrados:
También:
Por tanto la ecuación estimada es:
y para cada par de observaciones se satisface larelación
Los estimadores insesgados para se expresan de la siguiente manera:
Y el estimador insesgado de se expresa
Donde se denomina suma de cuadrados de los errores
También se puede encontrar a partir de:
Finalmente SCE se expresa así:
Errores estándares estimados.
PRUEBA DE HIPÓTESIS E INTERVALOS DE CONFIANZA PARA
Anteriormente hemos dicho que los erroresestán normalmente distribuidos por tanto
HIPÓTESIS PARA
Ho:
H1:
Donde : constante
Estadístico de prueba es:Sigue una distribución t con n-2 grados de libertad bajo Ho:
Se rechaza Ho: si
Cuando se da el caso especial de:
HIPÓTESIS
Ho:
H1:
Si Ho no se rechaza significa que la regresión entre X e Y no es lineal, por tanto X no sirve para predecir Y.
Si se rechaza significa que...
Regístrate para leer el documento completo.