Chi Cuadrado 2015
Bárbara Leyton D.
Unidad de Estadística. INTA, U. de Chile
Bioestadística. INTA 2015
Tablas de contingencia
Las tablas de contingencia están compuestas
por filas (horizontales) y columnas (verticales)
que delimitan celdas donde se vuelcan las
frecuencias de cada categoría analizada.
Bioestadística. INTA 2015
Tabla de contingencia de fxc
1
2
...
c
Total
1
O11
O12
...O1c
O1.
2
O21
O22
...
O2c
O2.
...
...
...
...
...
...
f
Of1
Of2
...
Ofc
Of.
Total O.1
O.2
...
O.c
O..
Oij frecuencia observada
Bioestadística. INTA 2015
Ejemplo: Tabla de contingencia de 4x3
1
2
3
Total
1
O11
O12
O13
O1.
2
O21
O22
O23
O2.
3
O31
O32
O33
O3.
4
O41
O42
O43
O4.
Total O.1
O.2
O.3
O..
Bioestadística. INTA 2015
Prueba deChi-cuadrado
La distribución Chi-cuadrado: Puede ser
utilizada en diversas situaciones para probar
hipótesis que involucran enumeración de
datos.
A continuación se muestran las principales
características de esta distribución:
Bioestadística. INTA 2015
Distribución Chi-cuadrado (2 )
• Es una distribución asimétrica.
• Solo toma valores positivos y es asintótica con
respecto al eje de las x positivas (0 <2 < +).
• Está caracterizada por un único parámetro
llamado: grados de libertad (g.l.)
• El área comprendida entre la curva y el eje de las x
es 1 o 100%.
Bioestadística. INTA 2015
Gráfico de la distribución Chi-cuadrado
No es simétrica
Región de
no rechazo
1-
Región de rechazo
2 gl,
Bioestadística. INTA 2015
Pearson (1900) propuso un estadístico que compara
las frecuenciasobservadas (Oi) con las frecuencias
esperadas (Ei), en base a la distribución de
probabilidad especificada. Concretamente, para una
variable discreta con k categorías o una variable
continua agrupada en k categorías, el contraste
definido por Pearson (1900) es el siguiente,
o
2
(Oi Ei )
2
~ g .l .
Ei
i 1
2
k
Bioestadística. INTA 2015
o
2
(Oi Ei )
Ei
i 1
k
2
(total fila i ) (total columna i) Oi Oi
Ei
total total
O
Oi: frecuencia observada en la celda i.
Ei: frecuencia esperada en la celda i.
Región de rechazo:
Si Chi-cuadrado calculado es mayor que el
de la tabla se rechaza H0 , la hipótesis nula
2
o
2
Se rechaza H0
Bioestadística. INTA 2015
Prueba Chi-cuadrado de Asociación
Frecuentemente al clasificar una muestra de
acuerdo a 2 característicasinteresa conocer
si hay alguna relación entre los 2 métodos de
clasificación.
Esta prueba permite analizar si dos variables
aleatorias son o no independientes.
Bioestadística. INTA 2015
Se contrasta la hipótesis:
¿Las categorías de las dos variables son
independientes entre sí o no?
El análisis Chi-cuadrado arroja un valor de
p determinado, que si es inferior a 0.05,
indica que existe una relaciónentre las
categorías estudiadas, o sea, que las
variables no son independientes entre sí.
Bioestadística. INTA 2015
Ejemplo
En un estudio sobre enfermedades al corazón,
356 voluntarios hombres, fueron clasificados de
acuerdo con su nivel socioeconómico (NSE) y
sus hábitos de fumar.
NSE
Alto
Medio
Bajo
Total
Hábito de fumar
Actualmente En el pasado Nunca
Total
51
22
43
92
21
28
68
9
22211
52
93
116
141
99
356
Bioestadística. INTA 2015
Las hipótesis a contrastar serán las siguientes:
H0: El hábito de fumar es independiente del NSE, es
decir, el porcentaje de hombres que fuman
actualmente es el mismo, ya sea el NSE alto, medio
o bajo.
La hipótesis alternativa será:
H1: El hábito de fumar no es independiente del NSE,
es decir, el porcentaje de hombres que fuman
actualmentees diferente en por lo menos dos de
las clasificaciones del NSE.
Bioestadística. INTA 2015
La frecuencia esperada se obtiene de acuerdo a H0,
o sea, que no hay diferencia entre los que fuman
actualmente.
Si esto es así, el mejor estimador para la proporción
en el grupo de los hombres que fuman actualmente
es:
116/356 = 0.3258
Entonces el valor esperado de los hombres que fuman
actualmente y...
Regístrate para leer el documento completo.