Almacen
1.1. Introducción.
La relación lineal es el tipo de correlación más censillo que se encuentra entre dos variables, una llamada variable independiente y otra llamada variable dependiente, debido a que esta última depende de los cambios que sufra la primera.
El objetivo de estudiar la correlación entre dos variables es con la esperanza de que la relaciónque se encuentre entre ellas pueda utilizarse como auxiliar en la realización de predicciones con cierta precisión establecida. Lo antes expuesto puede lograrse al ajustar una ecuación de primer grado de la forma [pic], a un conjunto de pares de valores de datos observados.
El tema contempla el estudio de los conceptos de correlación y regresión, obtención del diagrama de dispersión de losdatos, cálculo del coeficiente de correlación y regresión, obtención de la ecuación que mejor se ajusta a los valores observados, cálculo del error estándar de estimación, análisis de varianza para probar la significación de la regresión, estimación de intervalos de confianza en la regresión lineal y validación del modelo mediante el análisis residual.
1.2 Correlación lineal y regresión.
Lostérminos correlación y regresión pueden parecer complicados, sin embargo las ideas básicas implicadas en los mismos es tan sencilla que en gran parte del tiempo las estamos utilizando, para comprender mejor estos términos veamos los siguientes ejemplos.
Si se aplica cierto fertilizante en algún cultivo, comúnmente notamos que se obtiene un incremento en la producción a medida que se aumenta elnutriente hasta cierto punto, más allá de este punto la producción se estabiliza o disminuye si se utilizan cantidades excesivas de abono.
Este ejemplo implica dos variables, la magnitud de una dependiendo de la otra. Estas variables se denominan independiente (fertilizante) y dependiente (producción), presenta la idea de que cuando una variable se incrementa así lo hará la otra o viceversa, enestadística esto recibe el nombre de correlación directa o positiva.
Veamos otro ejemplo. Un instructor esta interesado en encontrar como está relacionada la ausencia de estudiantes en un día determinado, con la temperatura mínima en 0C a las 8 de la mañana de ese día, durante un periodo de invierno. Una muestra aleatoria de 10 días se utilizo para el estudio proporcionando los siguientesvalores.
|y |10 |4 |1 |9 |
| |[pic] | | | |
|Total | |n - 1 || |
| |[pic] | |S. C. regresión |C. M. Reg. |
|Regresión | |1 |G. L. regresión |C. M. error |
| | | |S. C.error | |
|Error |S. C. total – S. C. regresión |n – 2 |G. L. error | |
Si la probabilidad de tener una F igual a la obtenida en el ANOVA es menor al 5% se rechaza la hipótesis H0: b = 0 y se acepta la hipótesis H1: b ≠ 0, con lo que se concluye que la variable independiente influye demanera significativa en la variable dependiente.
Continuando con el ejemplo del efecto de la temperatura del horno y la resistencia de la varilla, los cálculos básicos para la obtención de las sumas de cuadrados son:
|[pic][pic] |[pic] |[pic] |
|[pic] |[pic] |b = 0.483...
Regístrate para leer el documento completo.