pepe
________________________________________
Los contrastes de hipótesis y la estimación de parámetros son los dos procedimientos más importantes de la Inferencia Estadística. Cuando hablamos de Inferencia Estadística es que queremos obtener conclusiones de una población (conjunto de elementos o resultados) a partir de los datos observados en un subconjunto de ella que sellama muestra. En particular, los contrastes de hipótesis sirven para juzgar si una afirmación que hacemos sobre una propiedad de la población es razonable o aceptable a la vista de los datos de una muestra aleatoria de la población o, si por el contrario, los datos observados proporcionan evidencia suficiente para rechazar esa afirmación.
Por ejemplo, supongamos que hemos revisado 200 bolígrafosde una marca y 20 de ellos no escriben, ¿podemos aceptar la afirmación del fabricante de que produce un 2% de bolígrafos defectuosos (no escriben)? En esta situación, partimos de una hipótesis a valorar: “el fabricante produce un 2% de defectuosos”, y debemos decidir si ello es o no razonable a la vista de los datos muestrales: observamos 20/200*100=10% de defectuosos.
Intuitivamente un 10% dedefectuosos (observación muestral) está bastante lejos de un 2% de defectuosos (hipótesis), así que parece que la muestra nos proporciona evidencia en contra de la hipótesis. Entonces decidimos que la hipótesis no es aceptable, aunque no podemos demostrar que es falsa (porque no hemos revisado todos los bolígrafos producidos por el fabricante sino una muestra de 200).
¿Qué decidiríamos si enlos 200 bolígrafos revisados hubiésemos encontrado 5 defectuosos (5/200*100=2,5%)? Un 2,5% (muestra) no es igual a un 2% (población), pero ¿es suficiente diferencia para rechazar la afirmación del fabricante o puede deberse al azar? El contraste de hipótesis nos proporciona un procedimiento para decidir si aceptar o rechazar la hipótesis utilizando la teoría de la probabilidad.
Para entender elprocedimiento de decisión de un contraste, vamos a definir algunos conceptos y ver cómo se escriben con lenguaje matemático:
- Se llama hipótesis nula, H0, a la que vamos a contrastar o juzgar y se llama hipótesis alternativa, H1, a una hipótesis complementaria (generalmente la contraria) que será la que aceptaremos si decidimos rechazar la hipótesis nula. Las hipótesis H0 y H1 se formulan sobreparámetros (media, proporción,…) u otras características (normalidad, simetría,…) de la población.
En nuestro ejemplo, ambas hipótesis se formulan sobre la proporción de bolígrafos defectuosos de ese fabricante, que denotamos por π. La hipótesis nula es H0: π=0,02(=2%) y como hipótesis alternativa consideramos H1: π≠0,02 (contraste bilateral).
Otro posible contraste sería plantear H0: π≤0,02 yH1: π>0,02 (contraste unilateral a la derecha), que se preocuparía por detectar si nos separamos de H0 debido solamente a que hay más de un 2% de defectuosos. En todo caso, por simplicidad, la hipótesis nula siempre contiene el signo igual.
- Se llama estadístico de contraste, D, a una fórmula que depende de la muestra y de la hipótesis nula y cuya distribución muestral es conocida cuando H0 escierta. Este estadístico mide la discrepancia entre la hipótesis nula y la información muestral, de forma que cuando hay mucha discrepancia los valores del estadístico nos indican rechazar H0 (región crítica) y en caso contrario nos indican aceptar la hipótesis nula (región de aceptación).
- Para elegir la región crítica (valores del estadístico que indican una discrepancia suficientemente grandepara rechazar H0) tenemos que tener en cuenta que al decidir aceptar o rechazar H0 podemos cometer dos tipos de errores, según el siguiente esquema:
Realidad (desconocida)
Decisión: H0 cierta H0 falsa
Aceptar H0 correcto Error tipo II
Rechazar H0 Error tipo I correcto
De forma que la elección de la región crítica debe minimizar la probabilidad de cometer los dos tipos de errores. La forma...
Regístrate para leer el documento completo.