Regresi N Lineal
En estadística la regresión lineal o ajuste lineal es un método matemático que modela la relación entre una variable dependiente Y, las variables independientes Xi y un término aleatorio ε. Este modelo puede ser expresado como:
: variable dependiente, explicada o regresando.
: variables explicativas, independientes o regresores.
: parámetros, miden la influencia que lasvariables explicativas tienen sobre el regresando.
donde es la intersección o término "constante", las son los parámetros respectivos a cada variable independiente, y es el número de parámetros independientes a tener en cuenta en la regresión. La regresión lineal puede ser contrastada con la regresión no lineal.
Índice
1 Historia
1.1 Etimología
2 El modelo de regresión lineal
3 Hipótesis del modelo deregresión lineal clásico
4 Supuestos del modelo de regresión lineal
5 Tipos de modelos de regresión lineal
5.1 Regresión lineal simple
5.1.1 Análisis
5.2 Regresión lineal múltiple
6 Rectas de regresión
7 Aplicaciones de la regresión lineal
7.1 Líneas de tendencia
7.2 Medicina
7.3 Informática
8 Véase también
9 Referencias
10 Bibliografía
11 Enlaces externos
Historia
La primera forma de regresiónlineal documentada fue el método de los mínimos cuadrados que fue publicada por Legendre en 1805,1 y en dónde se incluía una versión del teorema de Gauss-Márkov.
Etimología
El término regresión se utilizó por primera vez en el estudio de variables antropométricas: al comparar la estatura de padres e hijos, donde resultó que los hijos cuyos padres tenían una estatura muy superior alvalor medio,tendían a igualarse a éste, mientras que aquellos cuyos padres eran muy bajos tendían a reducir su diferencia respecto a la estatura media; es decir, "regresaban" al promedio.2 La constataciónempírica de esta propiedad se vio reforzada más tarde con la justificación teórica de ese fenómeno.
El término lineal se emplea para distinguirlo del resto de técnicas de regresión, que emplean modelos basados encualquier clase de función matemática. Los modelos lineales son una explicación simplificada de la realidad, mucho más ágiles y con un soporte teórico mucho más extenso por parte de la matemática y la estadística.
Pero bien, como se ha dicho, podemos usar el término lineal para distinguir modelos basados en cualquier clase de aplicación.
El modelo de regresión lineal
El modelo lineal relacionala variable dependiente Y con K variables explícitas (k = 1,...K), o cualquier transformación de éstas que generen un hiperplano de parámetros desconocidos:
(2)
donde es la perturbación aleatoria que recoge todos aquellos factores de la realidad no controlables u observables y que por tanto se asocian con el azar, y es la que confiere al modelo su carácter estocástico. En el caso más sencillo, conuna sola variable explícita, el hiperplano es una recta:
(3)
El problema de la regresión consiste en elegir unos valores determinados para los parámetros desconocidos , de modo que la ecuación quede completamente especificada. Para ello se necesita un conjunto de observaciones. En una observación i-ésima (i= 1,... I) cualquiera, se registra el comportamiento simultáneo de la variable dependiente ylas variables explícitas (las perturbaciones aleatorias se suponen no observables).
(4)
Los valores escogidos como estimadores de los parámetros , son los coeficientes de regresión sin que se pueda garantizar que coincida n con parámetros reales del proceso generador. Por tanto, en
(5)
Los valores son por su parte estimaciones o errores de la perturbación aleatoria.
Hipótesis del modelo deregresión lineal clásico
1. Esperanza matemática nula.
Para cada valor de X la perturbación tomará distintos valores de forma aleatoria, pero no tomará sistemáticamente valores positivos o negativos, sino que se supone tomará algunos valores mayores que cero y otros menores que cero, de tal forma que su valor esperado sea cero.
2. Homocedasticidad
para todo t
Todos los términos de la...
Regístrate para leer el documento completo.