Anova
Introducción
El análisis de la varianza (Anova) se debe al estadístico-genético Sir Ronald Aylmer Fisher (1890-1962), autor del libro "Statistics Methods for Research Workers" publicado en 1925 y pionero de la aplicación de métodos estadísticos en el diseño de experimentos, introduciendo el concepto de aleatorización. El Anova se puede utilizar en lassituaciones en las que nos interesa analizar una respuesta cuantitativa, llamada habitualmente variable dependiente, medida bajo ciertas condiciones experimentales identificadas por una o más variables categóricas (por ejemplo tratamiento, sexo), llamadas variables independientes. Cuando hay una sola variable que proporciona condiciones experimentales distintas, el análisis recibe el nombre de Anova de unfactor. Entre las pruebas de comparación múltiples a posteriori, que se utilizan a continuación de las técnicas del Anova, se encuentra la prueba HSD de Tukey. John Tukey es, asímismo, conocido por introducir la transformación rápida de Fourier, aunque trabajó en muchas áreas incluyendo sobre todo la filosofía de R. A. Fisher John Tukey
la estadística. Cuando el análisis de la varianza no esaplicable debido a incumplimientos de las suposiciones del modelo, es necesario aplicar la prueba de Kruskal-Wallis para el contraste de k medianas. Esta prueba es una ampliación de la prueba de Mann-Whitney-Wilcoxon para dos medianas. La prueba de Kruskal-Wallis fue propuesta por William Henry Kruskal (1919- ) y W. Allen Wallis (19121998) en el artículo "Use of ranks in one-criterion varianceanalysis" publicado en el “Journal of William H. Kruskal W. Allen Wallis
American Statistics Association” en 1952.
1
Fórmulas básicas
En el análisis de la varianza, la variación en la respuesta se divide en la variación entre los diferentes niveles del factor (los diferentes tratamientos) y la variación entre individuos dentro de cada nivel. Suponiendo que las medias de los grupos soniguales, la variación entre grupos es comparable a la variación entre individuos. Si la primera es mucho mayor que la segunda, puede indicar que las medias en realidad no son iguales. El objetivo principal del Anova es contrastar si existen diferencias entre las diferentes medias de los niveles de las variables (factores). Cuando sólo hay dos medias, el Anova es equivalente a la prueba tStudent para elcontraste de dos medias. La variación observada en la respuesta se asume que es debida al efecto de las variables categóricas, aunque también se asume que existe cierto error aleatorio independiente que explica la variación residual. Se asume también que dicho error aleatorio sigue una distribución normal con media 0 y varianza constante. Estas asunciones son análogas a las exigidas para la pruebat-Student para contrastar la igualdad de dos medias, donde se asumía normalidad de la respuesta en cada grupo e igualdad de varianzas (contrastada mediante la F-Snedecor). Para estudiar la validez del modelo es necesario confirmar estas hipótesis mediante el estudio de los residuos (valores predichos - valores observados): normalidad, tendencias, etc. y la realización de un contraste dehomocedasticidad (homogeneidad de varianzas entre los grupos). Para el estudio de la normalidad de los errores, se puede recurrir al estudio de la normalidad de cada grupo (al igual que en la prueba t-Student) pero no es recomendable, debido a que puede requerir un gran número de pruebas. La solución utilizada habitualmente es el estudio del gráfico de dispersión entre los residuos y los valores predichos.Este gráfico permite estudiar la simetría, si existen patrones de comportamiento, la independencia entre observaciones y tendencias en general. Si se observa algún comportamiento de los mencionados, el modelo no es válido y se debe cambiar de modelo, de técnica estadística o transformar las variables. Uno de los posibles contrastes para la homocedasticidad es la prueba de Barlett propuesta por...
Regístrate para leer el documento completo.