anova
1. Comparación de múltiples poblaciones
Ricard Boqué, Alicia Maroto
Grupo de Quimiometría y Cualimetría. Universitat Rovira i Virgili.
Pl. Imperial Tàrraco, 1. 43005-Tarragona
El análisis de la varianza (ANOVA) es una potente herramienta estadística, de gran
utilidad tanto en la industria, para el control de procesos, como en el laboratorio de
análisis,para el control de métodos analíticos. Los ejemplos de aplicación son
múltiples, pudiéndose agrupar, según el objetivo que persiguen, en dos
principalmente : la comparación de múltiples columnas de datos y la estimación de
los componentes de variación de un proceso. Nos ocupamos en este artículo de la
primera de ellas.
Comparación de múltiples poblaciones
La comparación de diversosconjuntos de resultados es habitual en los laboratorios
analíticos. Así, por ejemplo, puede interesar comparar diversos métodos de análisis
con diferentes características, diversos analistas entre sí, o una serie de
laboratorios que analizan una misma muestra con el mismo método (ensayos
colaborativos). También sería el caso cuando queremos analizar una muestra que
ha estado sometida a diferentestratamientos o ha estado almacenada en
diferentes condiciones. En todos estos ejemplos hay dos posibles fuentes de
variación: una es el error aleatorio en la medida y la otra es lo que se denomina
factor controlado (tipo de método, diferentes condiciones, analista o laboratorio,...).
Una de las herramientas estadísticas más utilizadas que permite la separación de
las diversas fuentes devariación es el análisis de la varianza (ANOVA, del inglés
Analysis of Variance) [Massart, 1997].
El ANOVA también puede utilizarse en situaciones donde ambas fuentes de
variación son aleatorias. Un ejemplo sería el análisis de algún compuesto de un
vino almacenado en un depósito. Supongamos que las muestras se toman
aleatoriamente de diferentes partes del depósito y se realizan diversos análisisreplicados. Aparte de la variación natural en la medida tendremos una variación en
la composición del vino de les diferentes partes del depósito.
1
Cuando tengamos un factor, controlado o aleatorio, aparte del error propio de la
medida, hablaremos del ANOVA de un factor. En el caso de que estuviésemos
desarrollando un nuevo método colorimétrico y quisiéramos investigar la influencia
dediversos factores independientes sobre la absorbancia, tales como la
concentración de reactivo A y la temperatura a la que tiene lugar la reacción,
entonces hablaríamos de un ANOVA de dos factores. En los casos donde tenemos
dos o más factores que influyen, se realizan los experimentos para todas las
combinaciones de los factores estudiados, seguido del ANOVA. Se puede deducir
entonces sicada uno de los factores o una interacción entre ellos tienen influencia
significativa en el resultado.
Para utilizar el ANOVA de forma satisfactoria deben cumplirse tres tipos de
hipótesis, aunque se aceptan ligeras desviaciones de las condiciones ideales:
1. Cada conjunto de datos debe ser independiente del resto.
2. Los resultados obtenidos para cada conjunto deben seguir una distribuciónnormal.
3. Las varianzas de cada conjunto de datos no deben diferir de forma
significativa.
ANOVA de un factor
Tomemos como ejemplo la comparación de 5 laboratorios que analizan nk veces
con el mismo procedimiento la concentración de Pb en una misma muestra de
agua de río. El objetivo del ANOVA aquí es comparar los errores sistemáticos con
los aleatorios obtenidos al realizar diversosanálisis en cada laboratorio. Hemos
comentado antes que son condiciones importantes que cada laboratorio analice
sus muestras de manera independiente y con precisiones parecidas a las del resto
de laboratorios. En la tabla 1 se muestran los resultados obtenidos (expresados en
µg/L).
2
Tabla 1. Resultados del análisis de plomo en agua de río realizado por 5 laboratorios (k
indica el nº de...
Regístrate para leer el documento completo.