Probabilidad y estadistica

Solo disponible en BuenasTareas
  • Páginas : 10 (2489 palabras )
  • Descarga(s) : 0
  • Publicado : 25 de abril de 2011
Leer documento completo
Vista previa del texto
Regresión lineal
En múltiples ocasiones en la práctica se requiere analizar la relación entre dos variables cuantitativas. Los dos objetivos fundamentales del análisis de regresión serán, por un lado, determinar si dichas variables están asociadas y en qué sentido se da dicha asociación (es decir, si los valores de una de las variables tienden a aumentar –o disminuir- al aumentar los valoresde la otra); y por otro, estudiar si los valores de una variable pueden ser utilizados para predecir el valor de la otra. 
La forma correcta de abordar el primer problema es recurriendo a coeficientes de correlación(1). Sin embargo, el estudio de la correlación es insuficiente para obtener una respuesta a la segunda cuestión: se limita a indicar la fuerza de la asociación mediante un úniconúmero, tratando las variables de modo simétrico, mientras que nosotros estaríamos interesados en modelar dicha relación y usar una de las variables para explicar la otra. Para tal propósito se recurrirá a la técnica de regresión. Aquí se analizará el caso más sencillo en el que se considera únicamente la relación entre dos variables. Así mismo, se limitará al caso en el que la relación que sepretende modelar es de tipo lineal
La recta de regresión.
Consideremos una variable aleatoria respuesta (o dependiente) Y, que supondremos relacionada con otra variable (no necesariamente aleatoria) que llamaremos explicativa, predictora o independiente y que se denotará por X.  A partir de una muestra de n individuos para los que se dispone de los valores de ambas variables, {(Xi,Yi),i = 1,...n}, sepuede visualizar gráficamente la relación existente entre ambas mediante un gráfico de dispersión, en el que los valores de la variable X se disponen en el eje horizontal y los de Y en el vertical.
En el siguiente gráfico se observa que la nube de puntos sigue una tendencia lineal:
[pic]

El problema que subyace a la metodología de la regresión lineal simple es el de encontrar una recta queajuste a la nube de puntos del diagrama así dibujado, y que pueda ser utilizada para predecir los valores de Y a partir de los de X.  La ecuación general de la recta de regresión será entonces de la forma:  Y = a + bX .
Para definir la recta hay que determinar los valores de los parámetros "a" y "b":
El parámetro "a" es el valor que toma la variable dependiente "y", cuando la variableindependiente "x" vale 0, y es el punto donde la recta cruza el eje vertical.
El parámetro "b" determina la pendiente de la recta, su grado de inclinación.
Tradicionalmente se ha recurrido para ello al método de mínimos cuadrados, que elige como recta de regresión a aquella que minimiza las distancias verticales de las observaciones a la recta.
La regresión lineal nos permite calcular elvalor de estos dos parámetros, definiendo la recta que mejor se ajusta a esta nube de puntos.

El parámetro "b" viene determinado por la siguiente fórmula:
[pic]

El parámetro "a" viene determinado por:
|[pic] |

Es la media de la variable "y", menos la media de la variable "x" multiplicada porel parámetro "b" que ya se ha calculado.

III. La línea de regresión

A. El criterio de los cuadrados menores

Las situaciones que se dan en la vida real no son siempre tan simples como la de la maestra y sus horas de trabajo.
Muchas veces se encuentran valores para dos variables presentados en una tabla con la que se puede construir un diagrama de dispersión.
Ejemplo:|estudiante |Razonamiento verbal |índice |
|1 |200 |2.3 |
|2 |365 |3 |
|3 |360 |4 |
|4...
tracking img