Regresion y correlacion simple
estatura y peso
cantidad de fertilizante y producción
sustrato y producto
Los análisis de regresión y correlación son técnicas estadísticas que estudian la naturaleza e intensidad de las relaciones entre variables.
Sirven para propósitos distintos y no deben sustituirse uno por otro en análisis
Predice y/o estima el valor dela variable dependiente en función de la variable independiente. Debe utilizarse cuando se controla la variable independiente
X variable independiente
Y variable dependiente
Mide el grado o intensidad de la asociación entre dos variables sin importar cual es su causa o efecto.
Variables correlacionadas. La variación de una variable está asociada con la variación de otra.Ninguna correlación Correlación positiva Correlación negativa
Supuestos que fundamentan la regresión lineal simple
Se dice que los valores de la variable independiente X son fijos. La variable X se mide sin error. Para cada valor de X existe una subpoblación de valores de Y. Todas las variancias de las subpoblaciones de Y son iguales. Todas las medias de las subpoblaciones de Y se encuentransobre la misma línea. Los valores Y son estadísticamente independientes.
El modelo de regresión puede representarse por la siguiente ecuación:
Donde: y = valor representativo de una de las subpoblaciones de Y. e = término de error
Si H0: β = 0 no es rechazada
a) La relación entre X y Y es lineal, pero β tiende tanto a cero que los datos de la muestraprobablemente no generarán ecuaciones útiles para predecir Y cuando el valor de X está dado; b) La relación entre X y Y no es lineal, el modelo curvilíneo ofrece un mejor ajuste para los datos.
Si H0: β = 0 es rechazada
a) La relación es lineal y de suficiente fuerza para justificar el uso de ecuaciones de regresión muestral para predecir y estimar Y con base en los valores de X; b) Los datos seajustan bien a un modelo lineal, pero algún modelo curvilíneo podría proporcionar un ajuste más adecuado.
Coeficiente de determinación r2
Describe la relación real entre la variable dependiente “Y” y la variable “X” Pasos para el análisis de regresión
Determinar si las suposiciones que fundamentan la relación lineal se cumplen o no en los datos disponibles para el análisisObtener la ecuación de la recta Evaluar la ecuación Si los datos se ajustan al modelo lineal, utilizar la ecuación para predecir y estimar
EJEMPLO: Un estudiante de la carrera de bromatología hace un experimento donde evalúa la relación entre el contenido de fibra (g/kg) en el pan de pulque y vida de anaquel en la panadería “La Reyna” de Saltillo, Coahuila, obteniendo los siguientesresultados: Pan 1 2 Cantidad de fibra 10 15 Dureza (lb/in2) 3 5
3
4 5 6
20
25 30 35
6
7 8 9
n= Ẋ= Ẏ= ∑X2 = ∑XY =
6 22.5 6.33 3,475 955
DIAGRAMA DE DISPERSIÓN Se representan los pares de valores X,Y como puntos en un sistema de ejes cartesianos.
Dureza (lb/in2 )
10
9 8 7 6 5 4 3 2 1
X = eje horizontal Y = eje vertical
El patrón obtenido sugiere la fuerza de la relaciónde dos variablesy la naturaleza básica de ésta.
0 0 5 10 15 20 Fibra (g/kg) 25 30 35 40
Método de mínimos cuadrados Se utiliza para obtener la recta deseada: recta de mínimos cuadrados
Es un valor sobre el eje de las Y Es el punto donde la recta cruza al eje vertical Y (ordenada al origen) Es la cantidad con la cual Y cambia por cada unidad de cambio en X (pendiente de la recta)
Elmétodo consiste en ajustar la recta que cumpla con la condición de que la suma de los cuadrados de las desviaciones de cada valor observado Y de su correspondiente valor Ŷ, sea mínima.
10
9 8 7
Pueden sustituirse los valores de X en la ecuación de la recta para obtener los valores correspondientes de Y
Dureza (lb/in2 )
6 5 4 3 2 1 0 0 5 10 15 20 Fibra (g/kg) 25 30 35 40
CRITERIO...
Regístrate para leer el documento completo.