Regresion

Solo disponible en BuenasTareas
  • Páginas : 37 (9009 palabras )
  • Descarga(s) : 4
  • Publicado : 24 de mayo de 2010
Leer documento completo
Vista previa del texto
Regresión

Teresa Villagarcía

1

1. Introducción.
En cualquier ciencia es necesario establecer relaciones entre variables que se presupone que tienen relación con el objeto de estudio. Si estas relaciones existen y son comprendidas, podemos entender el funcionamiento del sistema y, consecuentemente, prever su comportamiento futuro, incluso si las condiciones varían. Existen dos tipos derelaciones claras entre variables: 1. Relaciones deterministas. 2. Relaciones no deterministas Entendemos que una relación es determinista si podemos expresar la variable y en función de x : yfx

Esta relación indica que si x  20, y  f 20 siempre. Este modelo no permite ningún error de predicción y en la práctica no existe, pues hay errores en los aparatos de medida, que hacen que cuando x 20 el valor de y varíe en torno a f 20 de una medida a otra. Sin embargo en algunas circunstancias puede suponerse un modelo determinista. Por ejemplo un circuito eléctrico compuesto por una alimentación de 10 Voltios conectada a una resistencia de 5 Ohmios, tendrá una intensidad I  V  10  2Amperios, y el error será despreciable, por lo que si conectamos R 5 el circuito una y otra vezobtendremos 2 Amperios de intensidad. Muchas veces las relaciones son deconocidas o simplemente hay múltiples causas no asignables que hacen que el error en la medida sea muy grande. Así, cuando x  20, obtenemos muchos valores de y. En este caso podemos pensar que cuando x  20, y ß N f 20 ,  2 . Esto equivale a pensar que el modelo que siguen las variables es no determinista o probabilístico y puedeformularse como

y  f x u donde u es una perturbación aleatoria.

2. Modelos lineales.
Los modelos lineales probabilísticos pueden expresarse de la siguiente forma y  0  1x  u (1)

es decir el valor de y va variando linealmente con x, pero además existe un error aleatorio que hace que dos observaciones con la misma x no tengan necesariamente la misma y. 2

Ejemplo 1: Pesos y Alturas.Los datos de la tabla 1 son los pesos en Kg y Alturas en cm de parte de un conjunto de 117 alumnos de la Universidad Politécnica de Madrid.

Altura Peso 184 156 173 186  112 54 60 66 

180 76 La Figura 1 presenta datos de Pesos y Alturas del Ejemplo 1. Como puede observarse, aunque no existe una relación exacta entre el Peso y la altura de los individuos, el conocer la altura de unapersona ofrece importante información sobre su peso. Así, las personas más altas son también las que tienen más peso.
Pesos y Alturas 120 110 100 90 80 70 60 50 40 155

Pesos (Kg)

160

165

170

175 180 Alturas (cm)

185

190

195

200

Figura 1: Pesos y Alturas de estudiantes de la Universidad El análisis de regresión pretende encontrar una relación entre las variables Peso yAltura. Para ello consideremos y la variable dependiente, o variable a explicar. La variable independiente o explicativa se denominará x . El modelo de regresión asume que los valores de la variable y pueden dividirse en dos partes: Una parte lineal explicada por la variable x , y una parte no explicada. La formulación del modelo es yi  0  1xi  ui (2)

Esta relación indica que y varíalinealmente con x , pero que no todo el valor de y se explica con x . En términos de nuestro ejemplo podemos decir que el peso de un individuo aumenta 3

linealmente a medida que aumenta su altura, pero además de la altura existen otros muchos factores determinantes del mismo. En la ecuación (2) la parte  0   1 x i representa la parte lineal de la variación de y respecto a x . Esta parte se denominatambién parte determinista. La segunda parte, u i , se denomina parte aleatoria y representa la parte de y no explicada linealmente por x .

Pesos y Alturas 120 110 100 90 80 70 60 50 40 155

Pesos (Kg)

160

165

170

175 180 Alturas (cm)

185

190

195

200

Figura 2: Datos de pesos y alturas con la recta de regresión. La Figura 2 presenta la recta de regresión entre y y...
tracking img