Correlacion
Cuando analizábamos las variables unidimensionales considerábamos, entre otras medidas importantes, la media y la varianza. Ahora hemos visto que estasmedidas también podemos considerarlas de forma individual para cada una de las componentes de la variable bidimensional.
Si observamos con atención los términos
vemos que las cantidades y van alcuadrado y por tanto no pueden ser negativas.
La covarianza , es una manera de generalizar la varianza y se define como:
Como se ve, la fórmula es muy parecida a las de las varianzas. Essencillo comprobar que se verifica la siguiente expresión de , más útil en la práctica:
3.10.0.1 Proposición
Si las observaciones no están ordenadas en una tabla de doble entrada,entonces se tiene que
o lo que es lo mismo
3.10.0.2 Ejemplo
Se han clasificado 100 familias según el número de hijos varones ( ) o hembras ( ), en la tabla siguiente:
0 1 2 3 40 4 6 9 4 1
1 5 10 7 4 2
2 7 8 5 3 1
3 5 5 3 2 1
4 2 3 2 1 0
1.
Hallar las medias, varianzas y desviaciones típicas marginales.
2.
¿Qué número medio de hijas hay en aquellas familias quetienen 2 hijos?
3.
¿Qué número medio de hijos varones hay en aquellas familias que no tienen hijas?
4.
¿Qué número medio de hijos varones tienen aquellas familias que a lo sumo tienen 2 hijas?5.
Hallar la covarianza
Solución:En primer lugar, definimos las variables X= número de hijos varones, e Y=número de hijas y construimos la tabla con las frecuencias marginales, y con otrascantidades que nos son útiles en el cálculo de medias y varianzas:
y1 y2 y3 y4 y5
0 1 2 3 4
4 6 9 4 1 24 0 0 0
5 10 7 4 2 28 28 28 44
7 8 5 3 1 24 48 96 62
5 5 3 2 1 1648 144 63
2 3 2 1 0 8 32 128 40
23 32 26 14 5 100 156 396 209
0 32 52 42 20 146
0 32 104 126 80 342
de este modo, las medias marginales son
Calculamos después las varianzas...
Regístrate para leer el documento completo.