Regresion lineal

Solo disponible en BuenasTareas
  • Páginas : 5 (1215 palabras )
  • Descarga(s) : 0
  • Publicado : 6 de junio de 2011
Leer documento completo
Vista previa del texto
Regresión lineal
En estadística la regresión lineal o ajuste lineal es un método matemático que modeliza la relación entre una variable dependiente Y, las variables independientes Xi y un término aleatorio ε. Este modelo puede ser expresado como:


Donde β0 es la intersección o término "constante", las βi son los parámetros respectivos a cada variable independiente, y p es el número deparámetros independientes a tener en cuenta en la regresión. La regresión lineal puede ser contrastada con la regresión no lineal.

El modelo lineal relaciona la variable dependiente Y con K variables explicativas Xk (k = 1,...K), o cualquier transformación de éstas, que generan un hiperplano de parámetros βk desconocidos:
(2)
donde es la perturbación aleatoria que recoge todos aquellosfactores de la realidad no controlables u observables y que por tanto se asocian con el azar, y es la que confiere al modelo su carácter estocástico. En el caso más sencillo de dos variables explicativas, el hiperplano es una recta:
(3)
El problema de la regresión consiste en elegir unos valores determinados para los parámetros desconocidos βk, de modo que la ecuación quede completamenteespecificada. Para ello se necesita un conjunto de observaciones. En una observación cualquiera i-ésima (i= 1,... I) se registra el comportamiento simultáneo de la variable dependiente y las variables explicativas (las perturbaciones aleatorias se suponen no observables).
(4)
Los valores escogidos como estimadores de los parámetros, , son los coeficientes de regresión, sin que se pueda garantizar quecoinciden con parámetros reales del proceso generador. Por tanto, en
(5)
Los valores son por su parte estimaciones de la perturbación aleatoria o errores.
Tipos de modelos de regresión lineal
Existen diferentes tipos de regresión lineal que se clasifican de acuerdo a sus parámetros:
Regresión lineal simple
Sólo se maneja una variable independiente, por lo que sólo cuenta con dosparámetros. Son de la forma:6
(6)
donde es el error asociado a la medición del valor Xi y siguen los supuestos de modo que (media cero, varianza constante e igual a un σ y con ).
Análisis
Dado el modelo de regresión simple, si se calcula la esperanza (valor esperado) del valor Y, se obtiene:7
(7)
(8)
Calculando y . Para esto se buscan dichos parámetros que minimicen
Derivando respectoa β0 y β1 e igualando a cero, se obtiene:7
(9)
(10)
Obteniendo dos ecuaciones denominadas ecuaciones normales que generan la siguiente solución para ambos parámetros:6
(11)
(12)
Regresión lineal múltiple
Maneja varias variables independientes. Cuenta con varios parámetros. Se expresan de la forma:8
(13)
donde es el error asociado a la medición i del valor Xip y siguen lossupuestos de modo que (media cero, varianza constante e igual a un σ y con ).
Rectas de regresión
Las rectas de regresión son las rectas que mejor se ajustan a la nube de puntos (o también llamado diagrama de dispersión) generada por una distribución binomial. Matemáticamente, son posibles dos rectas de máximo ajuste:9
La recta de regresión de Y sobre X:
(14)
La recta de regresión deX sobre Y:
(15)
La correlación ("r") de las rectas determinará la calidad del ajuste. Si r es cercano o igual a 1, el ajuste será bueno; si r es cercano o igual a 0, se tratará de un ajuste malo. Ambas rectas de regresión se intersectan en un punto llamado centro de gravedad de la distribución.
Ejercicio 1:
En una cierta población se definen dos variables discretas: X1= hipertensiónarterial y X2= consumo excesivo de sal, ambas con los valores 0=no y 1=sí. La fdp conjunta podría ser
X1
X2 0 1
0 0,4 0,1
1 0,3 0,2
f(0,0)=0,4 quiere decir que la probabilidad de que un individuo no sea hipertenso (X1=0) y no tenga un consumo excesivo de sal (X2=0) es 0,4. Obsérvese que la suma de los valores de la fdp es 1.
A partir de esta fdp se puede calcular p.e. la probabilidad...
tracking img