Estadistica, regresión lineal
Objetivos:
1. Trazar el diagrama de dispersión.
2. Calcular el coeficiente de correlación de Pearson.
3. Calcular y explicar el uso de los coeficientes de determinación y de no determinación.
4. Determinar la ecuación que pueda utilizarse en pronósticos.
Introducción
La Regresión y la correlación son dos técnicasestadísticas que se pueden utilizar para solucionar problemas comunes en los negocios.
Muchos estudios se basan en la creencia de que es posible identificar y cuantificar alguna Relación Funcional entre dos o más variables, donde una variable depende de la otra variable.
Llamado también coeficiente de correlación de Pearson, se representa por r y es una medida que representa el grado deasociación entre dos variables cuantitativas X e Y.
Se puede decir que Y depende de X, en donde Y y X son dos variables cualquiera en un modelo de Regresión Simple.
"Y es una función de X"
Y = f(X)
El análisis de correlación
En ocasiones nos puede interesar estudiar si existe o no algún tipo de relación entre dos variables aleatorias.
• Entre las variables X e Y existe una relaciónde dependencia exacta si conociendo el valor de una se conoce exactamente el valor de la otra.
• X e Y son variables independientes si una variable no contiene información sobre la otra.
• La variable X contiene cierta información (incompleta) acerca de la variable Y, pudiéndose predecir aproximadamente el valor de Y a partir del conocimiento del valor que ha tomado X mediante laconstrucción de lo que llamaremos modelos de regresión; en estas situaciones diremos que X e Y son variables dependientes.
El objetivo del análisis de correlación lineal es determinar el grado dependencia o de asociación entre las variables dependientes e independientes.
El coeficiente de correlación fue originado por el investigador Kart Pearson aproximadamente en el año 1900. En particular,nos interesa cuantificar la intensidad de la relación lineal entre dos variables. El parámetro que nos da tal cuantificación es el coeficiente de correlación lineal de Pearson r, cuyo valor oscila entre –1 y +1.
Un coeficiente de correlación de -1.00 o de +1.00 indica correlación perfecta negativa o positiva respectivamente.
El Coeficiente de Correlación es una medida que proporciona lafuerza de asociación entre un conjunto de variables independientes y un conjunto de variables dependientes.
[pic]
Como se observa en los diagramas anteriores, el valor de r se aproxima a +1 cuando la correlación tiende a ser lineal directa (mayores valores de X significan mayores valores de Y), y se aproxima a –1 cuando la correlación tiende a ser lineal inversa.
[pic]Correlación Negativa Correlación Positiva
Dependencia Inversa Dependencia Directa
En aquellos casos en que el coeficiente de regresión lineal sea “cercano” a +1 o a –1, tiene sentido considerar la ecuación de la recta que “mejor se ajuste” a la nube de puntos (recta de mínimos cuadrados).
Diagrama de dispersión: gráfica que describe larelación entre las dos variables de interés y muestra la intensidad y el sentido de la relación de las mismas.
[pic]
El coeficiente de correlación nos indica la intensidad o grado de dependencia entre las variables X e Y. El coeficiente de correlación r es un número que se obtiene mediante la fórmula:
[pic]
Donde:
n es el numero de pares de observaciones.
(x es la suma de los valores de lavariable x.
(y es la suma de los valores de la variable y.
((x2) es la suma de los valores de la variable x elevados al cuadrado.
((y2) es la suma de los valores de la variable y elevados al cuadrado.
((x)2 es el cuadrado de la suma de valores de x.
((y)2 es el cuadrado de la suma de valores de y.
Análisis de correlación: se usa un grupo de técnicas estadísticas para medir la fuerza de la...
Regístrate para leer el documento completo.