jflfj

Páginas: 11 (2522 palabras) Publicado: 1 de junio de 2013
11. Análisis de la varianza
11.2 Introducción
Del mismo modo que el contraste generalizaba el contraste de dos proporciones, es necesario definir un nuevo contraste de hipótesis que sea aplicable en aquellas situaciones en las que el número de medias que queremos comparar sea superior a dos. Es por ello por lo que el análisis de la varianza, ANOVA11.1 surge como una generalización delcontraste para dos medias de la de Student, cuando el número de muestras a contrastar es mayor que dos.
Por ejemplo, supongamos que tenemos 3 muestras de diferentes tamaños que suponemos que provienen de tres poblaciones normales con la misma varianza:



Si queremos realizar el contraste




podríamos en plantearnos como primer método el fijar una cantidad próxima a cero y realizar loscontrastes siguientes con como nivel de significación:












de modo que se aceptaría H1 y se rechazaría H0 sólo si alguna de las hipótesis alternativas H1', H1'' ó H1''' es aceptada y rechazada su correspondiente hipótesis nula. El error de tipo I para este contraste es:




Por ello el nivel de significación obtenido para este contraste sobre la igualdad de medias de tresmuestras no es como hubiésemos esperado obtener inicialmente, sino . Por ejemplo, si tomamos un nivel de significación para cada uno de los contrastes de igualdad de dos medias, se obtendría que el nivel de significación (error de tipo I) para el contraste de las tres medias es de 1-0,93=0,27, lo que es una cantidad muy alta para lo que acostumbramos a usar.
En consecuencia, no es adecuadorealizar el contraste de igualdad de medias de varias muestras mediante una multitud de contrastes de igualdad de medias de dos muestras.
Una técnica que nos permite realizar el contraste de modo conveniente es la que exponemos en este capítulo y que se denomina análisis de la varianza.
11.4 ANOVA con un factor
Se denomina modelo factorial con un factor o ANOVA con un factor al modelo (lineal) enel que la variable analizada la hacemos depender de un sólo factor de tal manera que las causas de su variabilidad son englobadas en una componente aleatoria que se denomina error experimental:




Vamos a exponer esto con más claridad. Consideremos una variable sobre la que actúa un factor que puede presentarse bajo un determinado número de niveles, t. Por ejemplo podemos considerar unfármaco que se administra a t=3 grupos de personas y se les realiza cierta medición del efecto causado:
 
Resultado de la medición
Gripe (nivel 1)
5
3
2
5
4
3
 
 
 

Apendicitis (nivel 2)
8
9
6
7
8
9
10
8
10

Sanos (nivel 3)
2
3
2
1
2
3
2
 
 

En este caso los factores que influyen en las observaciones son tres: el que la persona padezca la gripe, apendicitis, oque esté sana.
De modo general podemos representar las t muestras (o niveles) del siguiente modo:
Niveles
Observaciones de X
tamaños muestrales
Nivel
x11
x12
 

x1n1
 
n1
Nivel
x21
x22

x2n2
 
 
n2
...
...
...
Nivel
xt1
xt2
 

 
xtnt
nt
donde por supuesto, los tamaños de cada muestra ni, no tienen por que ser iguales. En este caso decimos que se trata del modelono equilibrado.
11.4.0.1 Observación
De ahora en adelante asumiremos que las siguientes condiciones son verificadas por las t muestras:
Las observaciones proceden de poblaciones normales;
Las t muestras son aleatorias e independientes. Además, dentro de cada nivel las observaciones son independientes entre sí.
En el modelo de un factor suponemos que las observaciones del nivel i, xij,provienen de una variable Xij de forma que todas tienen la misma varianza --hipótesis de homocedasticidad:




o lo que es lo mismo,




De este modo es el valor esperado para las observaciones del nivel i, y los errores son variables aleatorias independientes, con valor esperado nulo, y con el mismo grado de dispersión para todas las observaciones.
Otro modo de escribir lo mismo...
Leer documento completo

Regístrate para leer el documento completo.

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS