Asociacio n entre variables correlacio n no parame trica
Asociación entre variables:
correlación no paramétrica
Jorge Camacho-Sandoval
_____________________________________________________________________________________
Resumen
_____________________________________________________________________________________
Se describe la forma de estimar el coeficiente de correlación de Spearman y las condiciones
en que resulta apropiada suutilización. También se describe como realizar una prueba de hipótesis
para determinar si el coeficiente estimado es significativamente distinto de cero.
_____________________________________________________________________________________
Abstract
_____________________________________________________________________________________
A description is made on how to estimate the Spearmancorrelation coefficient and in what
conditions it is appropriate to use it. Also, how to make hypotheses tests to determine if the
estimated coefficient is significantly different from zero is described.
En el número anterior (ACM 50: 94-96) se hizo referencia al análisis de correlación lineal
entre dos variables cuantitativas, conocido como el análisis de correlación de Pearson. Ese
método requiere,cuando se desea hacer pruebas de hipótesis o estimar intervalos de confianza
del coeficiente de correlación, como es usual, que las variables tengan una distribución normal
bivariada.
¿Qué pasa cuando las variables no tienen una distribución normal bivariada? Eso ocurre, por
ejemplo, cuando una o ambas variables se miden en una escala ordinal o de intervalo. Para ese
caso existen pruebas que no exigenese requisito. Dos de ellas son las pruebas de Spearman y de
Kendall; ambas utilizan, en vez de los valores de las variables, sus rangos, es decir, el número de
orden del valor de cada observación de la variable dentro del conjunto de observaciones. La
prueba de Spearman tiene la ventaja de ser muy sencilla de calcular.
Para estimar el coeficiente de correlación de Spearman, primero se debenobtener los rangos
para cada una de las observaciones de ambas variables. Para ello se considera una variable y se
asigna el rango 1 al valor más pequeño, 2 al siguiente valor más pequeño y así sucesivamente
hasta llegar al rango n que le corresponde a la observación con el valor más alto. Luego se repite
el procedimiento para la otra variable.
El coeficiente de correlación de Spearman, rS, se puedeobtener con la siguiente fórmula:
Profesor del Programa de Maestría en Epidemiología, Posgrado en
Ciencias Veterinarias, UNA.
Correspondencia:
Correo electrónico:
jcamacho@ice.co.cr
ISSN 0001-6002/2008/50/3/144-146
Acta Médica Costarricense, ©2008
Colegio de Médicos y Cirujanos
144
En donde n es el número de casos o pacientes y d es la diferencia entre los rangos de las
variables para cadapaciente o unidad de observación. No obstante, esa fórmula supone que no
hay valores repetidos, es decir que no hay 2 o más pacientes a los que les corresponda el mismo
rango para una misma variable. Si existen pacientes con valores repetidos, se les asigna a esos
pacientes el rango promedio y se usa una fórmula de cálculo alternativa.
AMC, vol 50 (3), julio-setiembre 2008
Cuadro 1. Puntuación deactividad motora en extremidades inferiores y balance en pacientes con
accidentes cerebro vasculares
Paciente
Actividad
Motora
(AM)
Balance
(B)
Rango
AM
1
30
12
2
11
1
3
30
4
20
5
Rango
B
(R. AM)2
(R. B)2
(R. AM) x
(R. B)
(R. AM)
- (R. B)
((R. AM)
- (R. B))2
17.5
15
306.25
225.00
262.50
2.5
6.25
4
1.5
16.00
2.25
6.00
2.5
6.25
14
17.5
18.5
306.25
342.25
323.75-1
1
14
10
18.5
100.00
342.25
185.00
-8.5
72.25
30
6
17.5
7
306.25
49.00
122.50
10.5
110.25
6
30
14
17.5
18.5
306.25
342.25
323.75
-1
1
7
30
13
17.5
16
306.25
256.00
280.00
1.5
2.25
8
22
3
12
4.5
144.00
20.25
54.00
7.5
56.25
9
18
9
7
11.5
49.00
132.25
80.50
-4.5
20.25
10
20
9
10
11.5
100.00
132.25
115.00
-1.5
2.25
11
30
14...
Regístrate para leer el documento completo.