Análisis De Datos Y Estadística Avanzada
Máster Interuniversitario de Astrofísica UCM+UAM Tema 4: Regresión lineal simple
Javier Gorgas y Nicolás Cardiel
Departamento de Astrofísica y Ciencias de la Atmósfera Facultad de Ciencias Físicas Universidad Complutense de Madrid
Tema 4: Regresión lineal simple (♣)
Análisis de datos y Estadística Avanzada
Curso 2010/2011 1
1 / 29Esquema
1
Introducción Análisis de regresión Tipos de regresión Regresión lineal simple Tratamiento clásico Tratamiento avanzado 6 métodos de ajuste por mínimos cuadrados
2
Tema 4: Regresión lineal simple (♣)
Análisis de datos y Estadística Avanzada
Curso 2010/2011 2
2 / 29
Introducción
Análisis de regresión
¿Qué es la regresión?
El término regresión fue acuñado porFrancis Galton en el siglo XIX para referirse a fenómenos biológicos: los descendientes de progenitores excepcionales son, en promedio, menos excepcionales que los progenitores, y más parecidos a sus ancestros más distantes (Galton utilizó el término reversion al hablar de guisantes en 1877, y regression al referirse a la altura de humanos en 1885).
Tema 4: Regresión lineal simple (♣)
Análisisde datos y Estadística Avanzada
Curso 2010/2011 3
4 / 29
Introducción
Análisis de regresión
Análisis de regresión
El análisis de regresión es un intento de examinar la relación que existe entre una variable dependiente (variable respuesta) y un conjunto de variables independientes (predictores). El modelo matemático que establece dicha relación es la ecuación de regresión. Lavariable dependiente se modela como una variable aleatoria. La ecuación de regresión contiene una serie de parámetros de regresión (“constantes”) que establecen la relación cuantitativa entre las variables independientes y la dependiente. Estos parámetros se estiman a partir de datos. Los parámetros de un modelo de regresión pueden estimarse de varias maneras, por ejemplo utilizando el método de mínimoscuadrados (OLS, del inglés ordinary least squares) el método de máxima verosimilitud técnicas bayesianas ...
Tema 4: Regresión lineal simple (♣)
Análisis de datos y Estadística Avanzada
Curso 2010/2011 4
5 / 29
Introducción
Tipos de regresión
Regresión lineal y no lineal
Regresión lineal: la relación entre la respuesta Y (variable dependiente) y las variables independientesXi es lineal En este sentido, una relación del tipo Y = β0 + β1 X 1 + β2 X 2 + . . . + βn X n . Y = β0 + β1 X + β2 X 2
también es lineal (lineal en X y X 2 ), aunque la representación gráfica no sea una línea recta. Algunos problemas no lineales pueden linealizarse realizando una transformación adecuada. Por ejemplo Y = abX se linealiza tomando logaritmos a ambos lados, es decir ln(Y) = ln(a) +ln(b)X . Regresión no lineal: aquella en la que la relación entre la respuesta y las variables independientes no es una función lineal o linealizable. En este tema vamos a concentrarnos en la regresión lineal simple: Y = α + βX . ¿Simple? ¡En absoluto!
Tema 4: Regresión lineal simple (♣) Análisis de datos y Estadística Avanzada Curso 2010/2011 5 7 / 29
Regresión lineal simple
Tratamientoclásico
Ejemplo de diagrama de dispersión. Los datos corresponden a las medidas de dispersión de velocidades y luminosidad en una muestra de 40 galaxias elípticas realizadas por Schechter P.L. (1980).
Cuando en un diagrama de dispersión los datos se distribuyen aproximadamente a lo largo de una línea reacta ajustaremos una recta de regresión. La regresión de y sobre x vendrá dada entonces pory = a + bx, con a y b dos parámetros a determinar. Gráficamente, a será la ordenada en el origen y b la pendiente de la recta.
Tema 4: Regresión lineal simple (♣) Análisis de datos y Estadística Avanzada Curso 2010/2011 6 9 / 29
Regresión lineal simple
Tratamiento clásico
¿Cómo se determina la recta de regresión?
Se minimiza la suma de los cuadrados de las distancias entre los...
Regístrate para leer el documento completo.