Intervalo de confianza
Juli´n de la Horra
a
Departamento de Matem´ticas U.A.M.
a
1
Introducci´n
o
En este cap´
ıtulo, vamos a abordar la estimaci´n mediante Intervalos de Cono
fianza, que es otro de los tres grandes conjuntos de t´cnicas que se utilizan
e
en la Inferencia Estad´
ıstica. La situaci´n general que vamos a considerar es
o
la misma que en el cap´
ıtulo anterior:Disponemos de una muestra aleatoria (X1 , ..., Xn ) de una caracter´
ıstica X
de una poblaci´n. Pensamos que esta caracter´
o
ıstica puede ser adecuadamente
modelizada mediante un modelo de probabilidad con funci´n de masa Pθ (x)
o
(en el caso discreto) o con funci´n de densidad fθ (x) (en el caso continuo).
o
En cualquiera de los casos, lo unico que nos falta por conocer es el valor del´
par´metro θ ∈ Θ, que es desconocido.
a
Lo que tratamos de hacer en este cap´
ıtulo es encontrar intervalos que
sirvan para estimar este par´metro desconocido, fijando el nivel de confianza
a
que queremos que tenga dicha estimaci´n. En primer lugar, se plantear´n
o
a
dos ejemplos sencillos que servir´n como motivaci´n.
a
o
Ejemplo 1.- En los ejercicios de c´lculo de probabilidades,siempre se
a
suele hablar de monedas equilibradas pero, naturalmente, no todas lo son.
Nos gustar´ conocer aproximadamente (estimar) la probabilidad de cara de
ıa
una determinada moneda, y llamamos p = P (Cara).
Necesitamos datos, para lo cual lanzamos la moneda, por ejemplo, 100
veces, y anotamos los resultados. Supongamos que obtenemos 55 caras y 45
cruces.
Desde un punto de vistaformal, las caras y las cruces pueden ser codificadas mediante unos y ceros, de modo que tenemos una muestra aleatoria
(X1 , ..., X100 ) de
X=
1 (si sale cara) con probabilidad p
0 (si sale cruz) con probabilidad 1 − p
y, por tanto, X puede ser modelizada mediante un modelo de Bernoulli con
par´metro p desoconocido.
a
Podemos estimar la probabilidad de cara, p, mediante el estimador dem´xima verosimilitud, que en este caso es:
a
p=x=
ˆ ¯
55
N´mero de caras obtenidas
u
=
= 0, 55
N´mero de lanzamientos
u
100
1
Ahora bien, cuando decimos que estimamos que p es 0,55, no estamos
afirmando que p valga exactamente 0,55; lo que realmente queremos decir es
que p valdr´, aproximadamente, 0,55. Esto de aproximadamente lo podemos
a
concretar en diferentes intervalos: (0,54 ;0,56), (0,50 ; 0,60), ...
Para decidir con qu´ intervalo nos quedamos, necesitamos una metodolog´
e
ıa
general que nos permita resolver este tipo de problemas de un modo sistem´tico y lo m´s objetivo posible.
a
a
Ejemplo 2.- En una f´brica, se est´ ensayando una nueva fibra sint´tica,
a
a
e
y se quiere conocer aproximadamente (estimar) cu´l es la resistencia media
a
a la rotura de lascuerdas fabricadas con esta nueva fibra. Llamaremos µ al
valor de esta resistencia media que se quiere estimar.
Necesitamos datos, para lo cual medimos la resistencia de, por ejemplo,
100 cuerdas, y anotamos los resultados. Supongamos que obtenemos una
resistencia media muestral de 31 unidades.
Desde un punto de vista formal, lo que tenemos es una muestra aleatoria
(X1 , ..., X100 ) de lacaracter´
ıstica X = “Resistencia a la rotura”, que puede
ser modelizada mediante una distribuci´n N (µ; σ), con par´metros µ y σ
o
a
desconocidos.
Podemos estimar la resistencia media de las cuerdas, µ, mediante el estimador de m´xima verosimilitud, que en este caso es:
a
µ = x = 31
ˆ ¯
Ahora bien, cuando decimos que estimamos que µ es 31, no estamos
afirmando que µ valga exactamente 31;lo que realmente queremos decir es
que µ valdr´, aproximadamente, 31. Esto de aproximadamente lo podemos
a
concretar en diferentes intervalos: (30 ; 32), (28 ; 34), ...
Para decidir con qu´ intervalo nos quedamos, necesitamos una metodolog´
e
ıa
general que nos permita resolver este tipo de problemas de un modo sistem´tico y lo m´s objetivo posible.
a
a
2
Intervalos de confianza...
Regístrate para leer el documento completo.