análisis multivariente
Analicemos los errores que se pueden cometer al aceptar o rechazar H0, cuales son las probabilidades de cometer cada uno de ellos y como se usa esto para determinar las regiones de rechazo y aceptación.
La hipótesis nula H0 puede ser verdadera o falsa, cosa que no conocemos.
Si H0 es verdadera y la rechazamos se comete un error llamado detipo I.
Si H0 es falsa y la aceptamos se comete un error llamado de tipo II.
Tabla de decisiones.
Hipótesis nula
Decisión
Verdadera
Falsa
Rechazar H0
Error tipo I
Decisión correcta
Aceptar H0
Decisión correcta
Error tipo II
La validez o bondad de una prueba de hipótesis se mide mediante las probabilidades de cometer cada uno de estos errores
probabilidad de cometer unerror de tipo I
probabilidad de cometer un error de tipo II
corresponde a la región de rechazo.
corresponde a la región de aceptación.
Volvamos al ejemplo que estábamos considerando.
Ejemplo. Sea p la proporción de consumidores que prefieren la marca A.
a) Ha: p > 0.5
H0: p = 0.5
b) Se seleccionan 100 consumidores y se les pregunta si prefieren la marca A.
En este caso lamuestra se extrae de una población binomial con parámetro p.
c) Estadística de prueba: x la cantidad de consumidores que prefieren A de los 100 de la muestra.
Error tipo I:
Supongamos que H0 es verdadera, es decir, se cumple que p = 0.5. Entonces se puede cometer un error tipo I, cuando se rechaza H0. Veamos como se calcula .
Como H0 es verdadera, x tiene una distribución binomial conparámetro p = 0.5. Como el tamaño n = 100 de la muestra es grande se puede suponer normal con
x = n p = 100 (0.5) = 50
x = = = 5
Si se define como
región de rechazo: x + 2 = 60,
la probabilidad de cometer un error tipo I, es decir de rechazar H0 siendo esta verdadera es
= P( x 60 ) = 0.025.
Es decir x caerá en la región de rechazo 2.5% de las veces, cometiéndose un error alrechazar H0 siendo verdadera. Vemos además que el valor de queda fijo al fijar la región de rechazo.
Error tipo II:
Supongamos que H0 es falsa, es decir, se cumple que p 0.5. Entonces se puede cometer un error tipo II.
Como H0 es falsa, x tiene una distribución binomial con parámetro p desconocido. Como el tamaño n = 100 de la muestra es grande se puede suponer normal con
= n p =100 p
= =
Aunque sabemos que la distribución de x es normal, como desconocemos p no es imposible calcular la probabilidad de x que caiga en un determinado intervalo, y por ende .
Sin embargo, podemos ver como se comporta de acuerdo a si p se encuentra cerca o lejos del valor estipulado en H0, que es 0.5.
Si p = 0.9, en la muestra de 100 consumidores casi la totalidad estará a favorde la marca A, con lo cual x estaría bastante cerca de 100. De este modo, tendríamos una evidencia muy fuerte para rechazar H0: p = 0.5, y por ende de no equivocarnos. Es decir, en este caso es chico.
Si p = 0.55, en la muestra de 100 consumidores casi la mitad estaría a favor de la marca A. De este modo, tendríamos evidencia como para aceptar H0: p = 0.5, y por ende de equivocarnos. Esdecir, en este caso es grande.
En definitiva, mientras mayor sea la diferencia entre p real y el que propone H0, menor es probabilidad de cometer un error tipo II, es decir, menor es .
Relación entre los dos tipos de errores.
corresponde a la región de rechazo.
corresponde a la región de aceptación.
Mientras más grande (chica) es la región de rechazo más chica (grande) es la región deaceptación.
Si crece (disminuye) entonces disminuye (crece).
En general se tiene,
Propiedades de y
1. El valor de se fija al escoger la región de rechazo.
2. El valor de dependerá del valor que se use para definir H0.
Mientras más grande (chica) sea la diferencia entre el valor que se use para definir H0 y el valor real del parámetro, menor (mayor) será .
3. Si ...
Regístrate para leer el documento completo.