analisis de regresion y correlacion
Cuando se trabaja con dos o más variables, es importante conocer la relación entre ellas. Si una o más variables son aleatorias, no habrá una relación unívocaentre los valores de dos de las variables -es decir, dado un valor de una variable (la variable controlada), hay un posible rango de valores de la otra- y por lo tanto se requiere una descripciónprobabilística. La relación probabilística de las variables, que se describe con la media y la varianza de una variable aleatoria en función de los valores de la otra variable, se conoce como análisis deregresión. Cuando el análisis se limita a funciones lineales, se trata de una regresión lineal, pero la regresión puede ser también de tipo no lineal. En algunos casos, problemas de regresión nolineal pueden convertirse en lineales mediante una transformación de las variables originales.
Figura 1. Análisis de Regresión lineal de datos de dos variables
de donde se obtiene
(3)
(4)donde
La línea de regresión de los mínimos cuadrados es entonces:
(5)
Esta línea de regresión es válida solamente en el rango de valores de x observados. Las ecuaciones (1) a (5) se refieren a laregresión de Y sobre X. Si X y Y son ambas variables aleatorias, puede obtenerse también la regresión de X sobre Y, siguiendo el mismo procedimiento; en este caso se obtendría la ecuación de regresiónde . En general, esta es una ecuación lineal diferente de . Sin embargo las dos ecuaciones siempre se interceptan en .
Ya que la tendencia general de la relación se explica con la línea de regresiónde la ecuación (5), la varianza alrededor de esta línea es la medida de dispersión, que es la varianza condicional . Para el caso en el cual la varianza condicional se asume constante en el rango deinterés de x, un estimado imparcial de la varianza es
(6)
que es igual a
Y por lo tanto, la desviación estándar condicional es .
Los coeficientes , y , son estimados de los valores reales...
Regístrate para leer el documento completo.