estadistica
CAPÍTULO 8: INTERVALOS DE CONFIANZA PARA PROPORCIONES
Y MEDIAS
Intervalos de Confianza para una proporción
Cuando hacemos un test de hipótesis decidimos sobre un valor hipotético del parámetro.
•
•
•
¿Qué proporción de mujeres espera compartir las tareas de la casa con su pareja?
¿Qué proporción de la población sufre de fatiga crónica?
¿Qué proporción de la poblaciónsufre de Cáncer?
Cada una de estas preguntas es sobre “el valor de la proporción P ”. Es decir, queremos
estimar P .
Una proporción muestral
$
p es un estimador puntual (un número) de la proporción en la
población P .
Un estimador de intervalo de confianza de la proporción en la población P , es un
intervalo, calculado a partir de los datos de la muestra, en el cual nosotros“confiamos” se
encuentra la proporción de la población P .
El nivel de confianza es la probabilidad de que el método de estimación nos dé un
intervalo que contiene al parámetro ( P en este caso). El nivel de confianza se denota por
1− α , donde valores comunes de son 0,10; 0,05; y 0,01, para una confianza de 90%,
95%, y 99%.
α
Para construir intervalos de confianza recordemos la distribuciónmuestral de la proporción
muestral
$
p:
p ~ N ( P,
ˆ &
P(1 − P)
) , entonces aproximadamente 95% de los valores de
n
estarán entre dos desviaciones estándar de P .
N ( P,
P(1 − P)
)
n
95%
4
p -2
p
p(1 -p)
n
p
p +2
p(1 - p)
n
$
p
Página 2 de 11
P(1 − P)
. Esperamos que el 95% de los intervalos de
n
P(1 − P)
confianza formados por p ± 1,96
vana contener al parámetro P y 5% no lo van a
ˆ
n
Hacemos un intervalo:
contener.
p ± 1,96
ˆ
El problema es que si no conocemos el parámetro no conocemos la desviación
estándar. Solución: Estimar la desviación estándar, con el error estándar de
S ( p) =
ˆ
$
p:
p (1 − p)
ˆ
ˆ
n
Un intervalo de 95% de confianza para P esta dado por:
p(1 - p)
ˆ
ˆ
p ± 1,96 ˆ
n
En teoría esta aproximación funciona bien si se cumple que:
práctica la comprobamos con:
nP ≥ 5 y n(1 − P ) ≥ 5 . En la
np ≥ 5 y n(1 − p) ≥ 5
ˆ
ˆ
FUMADORES
Se realiza un estudio para conocer la prevalencia (proporción) de los factores de riesgo
cardiovasculares en residentes de la ciudad de Talca, adultos de 18 a 74 años, el año 2005
(http://pifrecv.utalca.cl/)Tabaquismo
Total
n (%)
Hombres
n (%)
Mujeres
n (%)
Total
368 (36,5)
134 (39,5)
234 (35,0)
La tabla presenta la prevalencia de fumadores en la muestra de 1007 personas. Se quiere
estimar la proporción de adultos que fuman.
Obtenga el estimador puntual de la proporción buscada.
¿Un intervalo de confianza 95% para la verdadera proporción de adultos que fuman,
está dado por?Pensemos:
¿Sabemos si el intervalo de 95% de confianza contiene a la verdadera proporción en la
población que fuman?
¿Este nivel de 95% confianza significa que hay una probabilidad de 95% de que la
verdadera proporción P está en el intervalo [33,6 ; 39,5]?
¿Podemos extender estos resultados al resto de la población general de adultos?
Página 3 de 11
Interpretación!
El intervalo queconstruimos o contiene P o no lo contiene. No es correcto decir que la
probabilidad de que el intervalo [33,6; 39,5] contenga a P es 0,95. El valor del parámetro
P es fijo. No varía.
La interpretación del nivel de 95% de confianza tiene que ver con la proporción de veces
que intervalos como el que construimos contiene a P si lo hiciéramos muchas veces.
p
m.a.s #1
m.a.s. #2
m.a.s. #3m.a.s. #4
Si repetimos este procedimiento muchas veces, calculando muchos intervalos de
confianza de 95% para P , podemos esperar que aproximadamente 95% de estos
intervalos contenga P (y aproximadamente 5% no).
Revisemos los percentiles de la tabla N(0,1):
Nivel de Confianza
1− α
0,80
0,90
0,95
0,98
0,99
0,999
z
1−
N(0,1)
α
2
α
2
α
2
1−α
-z
1− α...
Regístrate para leer el documento completo.