base de datos
3.6 Prueba para diferencia de proporciones
En algunos diseños de investigación, el plan muestral requiere seleccionar dos muestras independientes, calcular las proporciones muestrales y usar la diferencia de las dos proporciones para estimar o probar una diferencia entre las mismas.
Las aplicaciones son similares a la diferencia de medias, por ejemplosi dos empresas consultoras ofrecen datos de proporciones de personas que van a votar por el PRI y al hacer dos estudios diferentes salen resultados ligeramente diferentes ¿pero qué tanta diferencia se requiere para que sea estadísticamente significativo? De eso se tratan las pruebas estadísticas de diferencias de proporciones.
El estadístico Z para estos casos se calcula de lasiguiente manera:
Ejemplo 1. Una muestra de 87 mujeres trabajadoras profesionales mostró que la cantidad promedio que pagan a un fondo de pensión privado el 5% de su sueldo. Una muestra de 76 hombres trabajadores profesionales muestra que la cantidad que paga a un fondo de pensión privado es el 6.1% de su sueldo. Un grupo activista de mujeres desea demostrar que las mujeres no pagan tanto como loshombres en fondos de pensión privados. Si se usa alfa = 0.01 ¿Se confirma lo que el grupo activista de mujeres desea demostrar o no?
Paso 1. Determinar la hipótesis Nula “Ho” y Alternativa “Ha”. Nótese que este problema es de una cola.
Ho: Lo que pagan las mujeres en el fondo de pensión es igual o mayor
a lo que pagan los hombres (algunos autores solo le colocan igual). Ha:
(El estudiantedebe describir la Ha)
La hipótesis alternativa es lo que las mujeres del grupo activista desea demostrar.
z = ( pˆ 1 -pˆ 2 ) − ( p1 -p2 )
( p ⋅ q ) 1
+ 1
n1
n 2
Donde:
p = n1pˆ 1 + n 2 pˆ 2
n1 + n2
q = 1 - p
pˆ 1 pˆ 2 p1
p2
= proporción de la muestra 1.
= proporción de la muestra 2.
= proporción de la población 1.
=proporción de la población 2.
n1 = tamaño de la muestra 1.
n2 = tamaño de la muestra 2.
Paso 2. Determinar el nivel de significancia. Definido por el analista, en este caso se desea usar α = 0.01
Gráficamente el nivel de significancia se distribuye en la curva de distribución normal tal como se muestra en la figura:
Región de
Paso 3. Calcular los intervalos queimplican ese nivel de significancia.
Para dicho nivel de significancia el valor de Z es: Z=-2.326
Gráficamente queda de la siguiente manera:
Z = -2.326
Región de
rechazo
de Ho
Región de aceptación de Ho
rechazo
de Ho
Región de
aceptación de Ho
Ho: pmujeres ≥ phombres
Despejando:
Ho: pmujeres - phombres ≥ 0
Para volverloecuación algunos autores toman:
Ho: pmujeres - phombres = 0
Ho: pmujeres - phombres = 0
Paso 4. Calcular el “estadístico” de la prueba.
El estadístico Z para estos casos se calcula de la siguiente manera:
z = ( pˆ 1 -pˆ 2 ) − ( p1 -p2 )
( p ⋅ q ) 1 + 1
Paso 5. Determinar si el estadístico cae dentro de la región que hace la
Hipótesis nula verdadera.
Z =-2.326
Región
Donde:
n1
n 2
de
rechazo de Ho
Región de aceptación de Ho
p = n1pˆ 1 + n 2 pˆ 2
n1 + n2
q = 1 - p
pˆ 1 pˆ 2 p1
p2
= proporción de la muestra 1.
= proporción de la muestra 2.
= proporción de la población 1.
= proporción de la población 2.
Ho: µ mujeres - µ hombres = 0
Estadístico de prueba z = -0.3069
n1 = tamaño de lamuestra 1. n2 = tamaño de la muestra 2.
Para el caso del presente ejemplo: considerando la población de
mujeres como 1 y la de hombres como 2 tenemos la siguiente
sustitución:
p = n1pˆ 1 + n 2 pˆ 2 = 87(0.05) + 76(0.061) = 0.0551288
Como podrá notarse, el estadístico esta DENTRO de la región que hace
verdadera la hipótesis nula.
Paso 6. Aceptar o rechazar la...
Regístrate para leer el documento completo.