Correlación Terminado
Una medida común de fuerza de la relación lineal en la muestra se denomina coeficiente de correlación muestral (o simplemente, coeficiente de correlación), y se denota por r. Se calcula a partir de los datos muéstrales de acuerdo con la formula siguiente.
326732383170Fórmula parael coeficiente de correlación
En regresión lineal, la fuerza de la relación lineal se mide por medio del coeficiente de correlación
r= n∑x∑yn∑x2-∑x2∙n∑y2-∑y2El valor de r siempre está entre -1 y 1, o puede ser igual a -1 o a 1. Los valores exactamente iguales a 1 o -1 indican que la línea de mínimos cuadrados cruza exactamente todos los puntos de datos. Si r se acerca a 1 o -1, pero noexactamente igual, entonces la línea está “cerca” de ajustarse a todas las puntuaciones de los datos, y decimos que la correlación entre r y y es “fuerte”. Si r es igual cero (0), no hay una correlación lineal, o la correlación es débil. Esto significaría que los puntos son un conglomerado totalmente desordenado. O puede ser que los puntos formen un patrón ordenado, pero no lineal. (En el ejemplo 3que sigue se verá más sobre este caso.) Si r no esta cerca de cero (0) ni cerca de 1 o -1, podríamos decir que la correlación lineal es “moderada”.
Un valor positivo de r indica una línea de regresión con pendiente positiva, en cuyo caso decimos que la correlación lineal entre r y y es directa; cuando x aumenta, y también aumenta. Un valor negativo de r significa que la línea tiene pendientenegativa, de modo que hay una relación inversa entre x y y: cuando x aumenta, y disminuye
Ejemplo 3: Encuentre r para los datos de edad e ingreso de la tabla 11.
Casi todos los valores necesarios para encontrar r se calcularon en el ejemplo 1.
n=10∑y=39,500∑x2=15.433∑x=375∑xy=1,604,800El único valor que falta es ∑y2. S cada y se eleva al cuadrado en los datos originales y se suman estoscuadrados, se obtiene.
∑y2=167, 660,000.Ahora, utilice la fórmula para encontrar r.
r= .98(a dos decimales)
Este valor de r cercano a 1 muestra que la edad y el ingreso en este pueblo están muy correlacionados. El hecho de que r sea positivo indica que la relación lineal es directa; cuando la edad aumenta, el ingreso también lo hace.
Como ya se mencionó, las curvas de mínimos cuadrados siempre nosiempre son líneas.
Si un diagrama de dispersión revela que las cantidades representadas por los datos pueden no estar relacionadas linealmente, entonces puede buscarse una curva de mejor representación de algún otro tipo. Por ejemplo, para cualquier conjunto de pares ordenados, la calculadora de gráficas TI-83 Plus calculará curvas de mejor representación como las que se muestran en la tabla 12(muchas de la cuales se examinaron en un capitulo anterior de este texto). Observe que un tipo común de relación en la naturaleza, la ley de los cuadrados inversos, se incluiría en las funciones de potencias (con b=-2).
TABLA 12Opciones de ajuste de curvas en la TI-83 Plus
Tipo de curva Ecuación
Lineal
Cuadrática
Cúbica
CuárticaLogarítmica
Exponencial
Potencia y=ax+by=ax2+bx+cy=ax3+bx2...
Regístrate para leer el documento completo.