Regresion y correlacion simple

Solo disponible en BuenasTareas
  • Páginas : 5 (1158 palabras )
  • Descarga(s) : 0
  • Publicado : 2 de marzo de 2011
Leer documento completo
Vista previa del texto
Estudio de la relación de dos variables:


estatura y peso




cantidad de fertilizante y producción
sustrato y producto

Los análisis de regresión y correlación son técnicas estadísticas que estudian la naturaleza e intensidad de las relaciones entre variables.
Sirven para propósitos distintos y no deben sustituirse uno por otro en análisis



Predice y/o estima el valor dela variable dependiente en función de la variable independiente. Debe utilizarse cuando se controla la variable independiente



X variable independiente
Y variable dependiente

Mide el grado o intensidad de la asociación entre dos variables sin importar cual es su causa o efecto.


Variables correlacionadas. La variación de una variable está asociada con la variación de otra.Ninguna correlación Correlación positiva Correlación negativa

Supuestos que fundamentan la regresión lineal simple


Se dice que los valores de la variable independiente X son fijos. La variable X se mide sin error. Para cada valor de X existe una subpoblación de valores de Y. Todas las variancias de las subpoblaciones de Y son iguales. Todas las medias de las subpoblaciones de Y se encuentransobre la misma línea. Los valores Y son estadísticamente independientes.

 

 



El modelo de regresión puede representarse por la siguiente ecuación:

Donde: y = valor representativo de una de las subpoblaciones de Y. e = término de error



Si H0: β = 0 no es rechazada

a) La relación entre X y Y es lineal, pero β tiende tanto a cero que los datos de la muestraprobablemente no generarán ecuaciones útiles para predecir Y cuando el valor de X está dado; b) La relación entre X y Y no es lineal, el modelo curvilíneo ofrece un mejor ajuste para los datos.



Si H0: β = 0 es rechazada

a) La relación es lineal y de suficiente fuerza para justificar el uso de ecuaciones de regresión muestral para predecir y estimar Y con base en los valores de X; b) Los datos seajustan bien a un modelo lineal, pero algún modelo curvilíneo podría proporcionar un ajuste más adecuado.



Coeficiente de determinación r2

Describe la relación real entre la variable dependiente “Y” y la variable “X” Pasos para el análisis de regresión


Determinar si las suposiciones que fundamentan la relación lineal se cumplen o no en los datos disponibles para el análisisObtener la ecuación de la recta Evaluar la ecuación Si los datos se ajustan al modelo lineal, utilizar la ecuación para predecir y estimar

  

EJEMPLO: Un estudiante de la carrera de bromatología hace un experimento donde evalúa la relación entre el contenido de fibra (g/kg) en el pan de pulque y vida de anaquel en la panadería “La Reyna” de Saltillo, Coahuila, obteniendo los siguientesresultados: Pan 1 2 Cantidad de fibra 10 15 Dureza (lb/in2) 3 5

3
4 5 6

20
25 30 35

6
7 8 9

n= Ẋ= Ẏ= ∑X2 = ∑XY =

6 22.5 6.33 3,475 955

DIAGRAMA DE DISPERSIÓN Se representan los pares de valores X,Y como puntos en un sistema de ejes cartesianos.
Dureza (lb/in2 )

10

9 8 7 6 5 4 3 2 1

X = eje horizontal Y = eje vertical

El patrón obtenido sugiere la fuerza de la relaciónde dos variablesy la naturaleza básica de ésta.

0 0 5 10 15 20 Fibra (g/kg) 25 30 35 40

Método de mínimos cuadrados Se utiliza para obtener la recta deseada: recta de mínimos cuadrados

Es un valor sobre el eje de las Y Es el punto donde la recta cruza al eje vertical Y (ordenada al origen) Es la cantidad con la cual Y cambia por cada unidad de cambio en X (pendiente de la recta)

Elmétodo consiste en ajustar la recta que cumpla con la condición de que la suma de los cuadrados de las desviaciones de cada valor observado Y de su correspondiente valor Ŷ, sea mínima.
10

9 8 7

Pueden sustituirse los valores de X en la ecuación de la recta para obtener los valores correspondientes de Y

Dureza (lb/in2 )

6 5 4 3 2 1 0 0 5 10 15 20 Fibra (g/kg) 25 30 35 40

CRITERIO...
tracking img