Regresion
Teresa Villagarcía
1
1. Introducción.
En cualquier ciencia es necesario establecer relaciones entre variables que se presupone que tienen relación con el objeto de estudio. Si estas relaciones existen y son comprendidas, podemos entender el funcionamiento del sistema y, consecuentemente, prever su comportamiento futuro, incluso si las condiciones varían. Existen dos tipos derelaciones claras entre variables: 1. Relaciones deterministas. 2. Relaciones no deterministas Entendemos que una relación es determinista si podemos expresar la variable y en función de x : yfx
Esta relación indica que si x 20, y f 20 siempre. Este modelo no permite ningún error de predicción y en la práctica no existe, pues hay errores en los aparatos de medida, que hacen que cuando x 20 el valor de y varíe en torno a f 20 de una medida a otra. Sin embargo en algunas circunstancias puede suponerse un modelo determinista. Por ejemplo un circuito eléctrico compuesto por una alimentación de 10 Voltios conectada a una resistencia de 5 Ohmios, tendrá una intensidad I V 10 2Amperios, y el error será despreciable, por lo que si conectamos R 5 el circuito una y otra vezobtendremos 2 Amperios de intensidad. Muchas veces las relaciones son deconocidas o simplemente hay múltiples causas no asignables que hacen que el error en la medida sea muy grande. Así, cuando x 20, obtenemos muchos valores de y. En este caso podemos pensar que cuando x 20, y ß N f 20 , 2 . Esto equivale a pensar que el modelo que siguen las variables es no determinista o probabilístico y puedeformularse como
y f x u donde u es una perturbación aleatoria.
2. Modelos lineales.
Los modelos lineales probabilísticos pueden expresarse de la siguiente forma y 0 1x u (1)
es decir el valor de y va variando linealmente con x, pero además existe un error aleatorio que hace que dos observaciones con la misma x no tengan necesariamente la misma y. 2
Ejemplo 1: Pesos y Alturas.Los datos de la tabla 1 son los pesos en Kg y Alturas en cm de parte de un conjunto de 117 alumnos de la Universidad Politécnica de Madrid.
Altura Peso 184 156 173 186 112 54 60 66
180 76 La Figura 1 presenta datos de Pesos y Alturas del Ejemplo 1. Como puede observarse, aunque no existe una relación exacta entre el Peso y la altura de los individuos, el conocer la altura de unapersona ofrece importante información sobre su peso. Así, las personas más altas son también las que tienen más peso.
Pesos y Alturas 120 110 100 90 80 70 60 50 40 155
Pesos (Kg)
160
165
170
175 180 Alturas (cm)
185
190
195
200
Figura 1: Pesos y Alturas de estudiantes de la Universidad El análisis de regresión pretende encontrar una relación entre las variables Peso yAltura. Para ello consideremos y la variable dependiente, o variable a explicar. La variable independiente o explicativa se denominará x . El modelo de regresión asume que los valores de la variable y pueden dividirse en dos partes: Una parte lineal explicada por la variable x , y una parte no explicada. La formulación del modelo es yi 0 1xi ui (2)
Esta relación indica que y varíalinealmente con x , pero que no todo el valor de y se explica con x . En términos de nuestro ejemplo podemos decir que el peso de un individuo aumenta 3
linealmente a medida que aumenta su altura, pero además de la altura existen otros muchos factores determinantes del mismo. En la ecuación (2) la parte 0 1 x i representa la parte lineal de la variación de y respecto a x . Esta parte se denominatambién parte determinista. La segunda parte, u i , se denomina parte aleatoria y representa la parte de y no explicada linealmente por x .
Pesos y Alturas 120 110 100 90 80 70 60 50 40 155
Pesos (Kg)
160
165
170
175 180 Alturas (cm)
185
190
195
200
Figura 2: Datos de pesos y alturas con la recta de regresión. La Figura 2 presenta la recta de regresión entre y y...
Regístrate para leer el documento completo.