datos categoricos
Bondad de ajuste – Independencia – homogeneidad
Ing. Luis Eladio Rodríguez González, M.Eng., M.A.E.
Prueba de Bondad de Ajuste
En pruebas de hipótesis se estudian parámetros de una población (como medias 𝜇, proporciones 𝜌 ó varianzas 𝜎 2 )
BONDAD DE AJUSTE: para determinar si una población tiene una Dn teórica específica.
•
Son un método NO paramétrico: no esnecesario suposiciones respecto a la forma de la población.
•
Muy útil para datos medidos en una escala nominal (los datos solo se clasifican y no hay un orden natural).
Propósito:
•
Comparar una Dn observada con una Dn esperada.
•
Nivel de ajuste entre la frecuencia observada (𝑂𝑖 ) en una muestra y las frecuencias esperadas (e𝑖 ) a partir de la Dn hipotética.
Estadístico sobre el que se basala decisión
𝜒2
=
𝑂𝑖 −𝑒𝑖 2
𝑘
𝑖=1
𝑒𝑖
𝜒 2 = aproximado Dn Chi-cuadrado
𝛼
k = celdas (resultados posibles de un experimento)
𝑂𝑖 = frecuencia observada
𝑒𝑖 = frecuencias esperadas
0
𝜒𝛼2
𝑔𝑙 = k − 1
Si las frecuencias observadas (𝑂𝑖 ) se acercan a las frecuencias esperadas (e𝑖 ), el valor 𝜒 2 será pequeño, lo cual indica un buen ajuste.
Un buen ajuste conduce a la aceptación de H₀, casocontrario su rechazo.
2
Prueba de Bondad de Ajuste
(Frecuencias esperadas iguales)
Ejemplo. Walpole, página 371
(Dn uniforme discreta):
Considere el lanzamiento de un dado.
Suponga que un dado se lanza 120 veces y se registra cada resultado. Teóricamente se espera que cada cara ocurra 20 veces (6 x 20 = 120)
pero al comparar los resultados observados con los esperados no hay coincidencia. Utilizar 𝛼= 0,05.
Frecuencias resultantes de 120 lanzamientos
CARA
1
2
3
4
5
Observadas
20
22
17
18
19
Esperadas
20
20
20
20
20
Solución
𝜒2 =
𝜒2 =
6
24
20
¿Las diferencias son producto del error de
muestreo, de que el dado no es legal o de que
la Dn de resultados no es uniforme?
H₀: 𝐷𝑛 𝑢𝑛𝑖𝑓𝑜𝑟𝑚𝑒
H₁: 𝑂𝑡𝑟𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛
Para 𝑔𝑙 = k – 1 = 6 – 1 = 5
𝑂𝑖 −𝑒𝑖 2
𝑘
𝑖=1
𝑒𝑖
20−20 2
20
+
22−20 2
20
+
17−20 220
+
18−20 2
20
+
19−20 2
20
+
24−20 2
20
= 1,7
Se acepta H₀ si: 𝜒 2 < 𝜒𝛼2
( 𝜒 2 = 1,7) < ( 𝜒𝛼2 = 11,07)
RESPUESTA: Se Acepta H₀, se puede considerar Dn uniforme ya que ( 𝜒 2 = 1,7) < ( 𝜒𝛼2 = 11,07).
3
Prueba de Bondad de Ajuste
(Frecuencias esperadas iguales)
UTILIZANDO MINITAB:
Ejemplo (Dn uniforme discreta):
Se Acepta H₀, se puede considerar Dn uniforme.
Ya que ( 𝜒 = 1,7) <
Ejemplo(Dn uniforme discreta):
RESPUESTA:
RESPUESTA:
2
UTILIZANDO MEGASTAT:
( 𝜒𝛼2
= 11,07) y además p-value > 0,05
Se Acepta H₀, se puede considerar Dn uniforme.
Ya que ( 𝜒 2 = 1,7) < ( 𝜒𝛼2 = 11,07) y además p-value > 0,05
4
Prueba de Bondad de Ajuste
(Frecuencias esperadas iguales)
Ejemplo 10.79. Walpole, página 382
(Proporción):
Una máquina mezcla cacahuates, avellanas, castañas y pacanas arazón de 5:2:2:1. Se observa que 1 lata con 500 nueces mezcladas tiene 269
cacahuates, 112 avellanas, 74 castañas y 45 pacanas. A un nivel de significancia de 𝛼 = 0,05 pruebe la hipótesis de que la máquina mezcla a
razón de 5:2:2:1.
Solución
H₀:la máquina mezcla a razón de 5:2:2:1.
H₁: Es diferente la razón de mezcla
RESPUESTA:
Se rechaza H₀, la máquina NO mezcla a razón de 5:2:2:1.
Ya que ( 𝜒2 = 10,14) > ( 𝜒𝛼2 = 7,815) y además p-value < 0,05
5
Prueba de Bondad de Ajuste
(Frecuencias esperadas NO iguales)
Ejemplo. Walpole, página 372
Dn frecuencias duración baterias
(Dn Normal):
N° Límites clase
𝑂𝑖
1°
2°
3°
4°
5°
6°
7°
2
1
4
15
10
5
3
En la siguiente tabla se muestra una distribución de frecuencias de la duración
de 40 baterías.
¿La Dn de Frecuencias de la duración de lasbaterías se puede aproximar a una
Dn Normal con media 𝜇= 3,5 y desviación 𝜎= 0,7.
1,45 - 1,95
1,95 - 2,45
2,45 - 2,95
2,95 - 3,45
3,45 - 3,95
3,95 - 4,45
4,45 - 4,95
Solución
Se procede a calcular las frecuencias esperadas. Se obtienen calculando las áreas bajo la curva normal que se encuentra entre los
límites de clase.
Frecuencia esperada clase N°1
𝑍=
𝑥−𝜇
𝜎
=
1,95−3,5
0,7
= -2,214
P (Z...
Regístrate para leer el documento completo.