TEORIA Simetria Y Curtosis Corrrelacion Y Covariacion Regresion Lineal 2016
1.Concepto de correlación y covarianza
1.1. Relación y variación conjunta
El concepto de relación en estadística coincide con lo que se entiende por relación en el lenguaje habitual: dos variables están relacionadas si varían conjuntamente. Si los sujetos tienen valores, altos o bajos, simultáneamente en dos variables, tenemos una relación positiva.
Por ejemplo
Peso yaltura
En una muestra de niños de 5 a 12 años: los mayores en edad son también los más altos y pesan más, y los más jóvenes son los que pesan menos son más bajos de estatura; decimos que peso y altura son dos variables que están relacionadas porque los más altos pesan más y los más bajos pesan menos.
Si los valores altos en una variable coinciden con valores bajos en otra variable, tenemos unarelación negativa;
Por ejemplo
Edad fuerza física.
En una muestra de adultos de 30 a 80 años de edad: los mayores en edad son los menores en fuerza física; hay una relación, que puede ser muy grande, pero negativa: según los sujetos aumentan en una variable (edad) disminuyen en la otra (fuerza física).
La correlación se define por lo tanto por la co-variación (co= conjuntamente: variara lavez)
.
Correlación y covarianza son términos conceptualmente equivalentes, expresan lo mismo. La covarianza es también una medida de relación, lo mismo que el coeficiente de correlación.
Habitualmente se utiliza el coeficiente de correlación (R de Pearson), pero es útil entender simultáneamente qué es la covarianza, y entenderlo precisamente en este contexto, el de las medidas de relación.
Elconcepto de relación y qué se mide exactamente con estos coeficientes, lo veremos mejor con un ejemplo (tabla 1) donde tenemos los datos de tres situaciones o casos distintos:
1) En cada caso tenemos cuatro sujetos (ejemplo reducido para poder ver todos los datos con facilidad) con puntuaciones en dos variables,
X (un test de inteligencia) e
Y (una prueba objetiva de rendimiento).
2) Junto a lapuntuación de cada sujeto en las dos variables, X e Y, ponemos su número de orden:
Decimos por lo tanto que existe relación en la medida en que los sujetos ocupan la misma posición relativa en las dos variables.
En el caso 1º la relación es positiva; si el orden es inverso, como en el caso 2º, tenemos también una relación, pero negativa. Esta variación conjunta o co-variación, puede ser clara yalta (como en los casos 1º y 2ºde la tabla 1), puede ser moderada o baja o puede no haber relación (como en el caso 3º).
1.2. Los diagramas de dispersión
La representación gráfica de estos pares de puntuaciones se denomina diagrama de dispersión, y también nos ayuda a entender el mismo concepto de relación (ejemplos en la figura 1).
Cada punto representa la posición de un sujeto (dondeconfluyen sus dos puntuaciones). En la medida en que hay relación, los puntos tienden a situarse en una recta diagonal; cuando no hay relación o es muy pequeña la nube de puntos aparece sin una dirección clara.
1. Correlación, covarianza y dispersión: importancia de las diferencias
Es importante caer en la cuenta desde el principio de la importancia de las diferencias Interindividuales para podercomprobar relaciones: sin diferencias en los sujetos (u objetos) no podemos ver relaciones.
Sin diferencias en las dos variables no podemos encontrar variación conjunta: si todos los sujetos tienen idéntica puntuación en X no podemos ver si los altos en X
Son también altos en Y, porque en X son todos iguales.
Si, por ejemplo, queremos comprobar si la altura está relacionada con la capacidadde Encestar (jugando al baloncesto) necesitaremos jugadores de distintas alturas, para ver si los más altos encestan más y los más bajos encestan menos. Si todos los jugadores tienen la misma altura, no podemos comprobar esa relación; no podemos comprobar si las diferencias en altura se corresponden con diferencias en la habilidad de encestar porque todos tienen idéntica altura. Y también...
Regístrate para leer el documento completo.