INFORMATICAIIIIII

Páginas: 7 (1577 palabras) Publicado: 9 de junio de 2015








REGRECIÓN, CORRELACIÓN Y APLICACIONES










ESTADISTICA Y ORGANIZACIÓN DE LA INFORMATICA




Correlación de Pearson
En estadística, el coeficiente de correlación de Pearson es una medida de la relación lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables.
De maneramenos formal, podemos definir el coeficiente de correlación de Pearson como un índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas.
Definición
En el caso de que se esté estudiando dos variables aleatorias x e y sobre una población; el coeficiente de correlación de Pearson se simboliza con la letra , siendo la expresión quenos permite calcularlo:



Donde:
• Es la covarianza de
• Es la desviación típica de la variable
• Es la desviación típica de la variable

De manera análoga podemos calcular este coeficiente sobre un estadístico muestra, denotado como a:




Interpretación
El valor del índice de correlación varía en el intervalo [-1,1]:
Si r = 1, existe una correlación positiva perfecta. Elíndice indica una dependencia total entre las dos variables denominada relación directa: cuando una de ellas aumenta, la otra también lo hace en proporción constante.
Si 0 < r < 1, existe una correlación positiva.
Si r = 0, no existe relación lineal. Pero esto no necesariamente implica que las variables son independientes: pueden existir todavía relaciones no lineales entre las dos variables.
Si -1< r < 0, existe una correlación negativa.
Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia total entre las dos variables llamada relación inversa: cuando una de ellas aumenta, la otra disminuye en proporción constante.

Correlación de Spearman
En estadística, el coeficiente de correlación de Spearman, ρ (rho) es una medida de la correlación (la asociacióno interdependencia) entre dos variables aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados por su respectivo orden.

El estadístico ρ viene dado por la expresión:



Donde D es la diferencia entre los correspondientes estadísticos de orden de x - y. N es el número de parejas.
Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos,aunque si éstos son pocos, se puede ignorar tal circunstancia.
Para muestras mayores de 20 observaciones, podemos utilizar la siguiente aproximación a la distribución t de Student.



La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significano correlación pero no independencia. La tau de Kendall es un coeficiente de correlación por rangos, inversiones entre dos ordenaciones de una distribución normal bivariante.

Ejemplo
Los datos brutos usados en este ejemplo se ven debajo.

CI Horas de TV a la semana
106 786 0
100 28
100 50
99 28
103 2897 20
113 12
113 7
110 17
El primer paso es ordenar los datos de la primera columna. Se agregan dos columnas 'orden (i)' y 'orden (t)'
Para el orden i, se...
Leer documento completo

Regístrate para leer el documento completo.

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS