Analisis Datos Cualitativos
CUALITATIVOS
José Vicéns Otero
Eva Medina Moral
Enero 2005
1. CONSTRUCCIÓN DE UNA TABLA DE CONTINGENCIA
Para analizar la relación de dependencia o independencia entre dos variables
cualitativas nominales o factores, es necesario estudiar su distribución conjunta o tabla
de contingencia.
La tabla de contingencia es una tabla de doble entrada, donde en cada casillafigurará el número de casos o individuos que poseen un nivel de uno de los factores o
características analizadas y otro nivel del otro factor analizado.
SEXO
HOMBRE
MARGINAL
SI
n11
n12
n1 .
NO
n21
n22
n2 .
MARGINAL
FUMA
MUJER
n.1
n.2
N
donde
nij = número de observaciones que tienen el atributo i y j
ni. = número de individuos que tie nen elatributo i (marginal i)
n.j = número de individuos que tienen el atributo j (marginal j)
La tabla de contingencia se define por el número de atributos o variables que se
analizan conjuntamente y el número de modalidades o niveles de los mismos. El
ejemplo propuesto es una tabla de contingencia 2x2, ya que tiene dos atributos (FUMA
Y SEXO) y cada uno de ellos tiene dos niveles. Si quisiéramosanalizar conjuntamente
tres variables nominales, como por ejemplo, Fumar, Sexo y Edad, y esta última variable
tuviera tres niveles (40 años), obtendríamos tres tablas
como la anterior, una para cada modalidad de edad y la tabla de contingencia tendría
una dimensión 3×2×2.
Las tablas de contingencia tienen dos objetivos fundamentales:
1) Organizar la información contenida en un experimentocuando ésta es de carácter
bidimensional, es decir, cuando está referida a dos factores (variables cualitativas).
SEXO
HOMBRE
MARGINAL
SI
65
58
123
NO
43
67
110
MARGINAL
FUMA
MUJER
108
125
233
En esta tabla se puede observar en primer lugar que de los 233 individuos de los que
se tiene información 108 son hombres y 125 son mujeres. Asimismo sesabe que
123 de ellos fuman y 110 no. La tabla de contingencia nos permite tener
información cruzada sobre ambas variables: de los 108 hombres, 65 fuman y 43 no,
mientras que en el caso de las mujeres, 58 fuman y 67 no.
2) A partir de la tabla de contingencia se puede además analizar si existe alguna
relación de dependencia o independencia entre los niveles de las variables
cualitativas objetode estudio. El hecho de que dos variables sean independiente
significa que los valores de una de ellas no están influidos por la modalidad o nivel
que adopte la otra.
2. CONTRASTACIÓN ESTADÍSTICA DE LA RELACIÓN DE DEPENDENCIA
PARA VARIABLES CUALITATIVAS
Para identificar relaciones de dependencia entre variables cualitativas se utiliza un
contraste estadístico basado en el estadístico χ2(Chi-cuadrado), cuyo cálculo nos
permitirá afirmar con un nivel de confianza estadístico determinado si los niveles de
una variable cualitativa influyen en los niveles de la otra variable nominal analizada.
Siguiendo con el ejemplo propuesto, el cálculo de la Chi-cuadrado nos permitiría
saber si el sexo de una persona es un factor determinante en que dicha persona fume
o no fume.
¿Cómo podemosdeterminar si existe una relación de dependencia o independencia
entre las variables analizadas?
Dos variables son independientes si:
a) las frecuencias relativas condicionadas son iguales a las frecuencias relativas
marginales, es decir:
f ( A1 / B1 ) =
f ( A2 / B1 ) =
n1 j n1•
n11
n
= f ( A1 / B2 ) = 12 = .... = f ( A1 / B j ) =
=
n1•
n1•
n1•
N
n 2 j n2•
n 21
n
= f ( A2 /B2 ) = 22 = .... = f ( A2 / B j ) =
=
n2•
n 2•
n2•
N
f ( Ai / B j ) =
nij
ni•
= f ij =
ni•
N
= f ji =
n• j
Frecuencias relativas marginales:
f ( B j / Ai ) =
nij
n• j
N
b) O bien si se cumple que la frecuencia relativa conjunta es igual al produc to de
las frecuencias relativas marginales:
f ( Ai ∩ B j ) =
n ij
N
=
ni • n• j
x
NN
De esta...
Regístrate para leer el documento completo.