Licenciada en Estadistica
ANÁLISIS DE LA VARIANZA
14.1. INTRODUCCIÓN
Las pruebas de hipótesis consideradas hasta ahora, primeramente se refirieron a problemas donde los datos eran proporciones o frecuencias (análisis inferencial de datos categóricos) y, luego se pasó a problemas relacionados con la media o la varianza de poblaciones donde se vieron diferentes casos:a) para una muestra, pruebas referidas a una media poblacional (H0: = o) o bien a una varianza poblacional (H0: 2 = 2o), que requirieron aplicar la distribución en el muestreo de un estadígrafo Z o T, o bien (n-1)S2/ 2 respectivamente y,
b) para dos muestras, referidas a dos medias poblacionales (H0: 1= 2 ) o bien a dos varianza poblacionales (H0: 21 = 22), que también requirieronaplicar la distribución en el muestreo de un estadígrafo Z o T, o bien 2, respectivamente.
A menudo interesa la comparación de más de dos poblaciones, por ejemplo esto ocurre cuando se quiere comparar el rendimiento de tres líneas de producción industrial, los resultados de cinco analistas o bien cinco métodos de determinación, el efecto de varios insecticidas en el control de pulgones, elrendimiento de veinte híbridos de maíz, etc. Con las herramientas disponibles hasta ahora, se debería proceder a efectuar todas las comparaciones posibles de las poblaciones tomadas de a pares, pero este procedimiento implicaría comparaciones que no son independientes entre sí, lo cual afectaría el nivel de significación de la prueba (en lugar del fijado se estaría evaluando a otro nivel). Así parael caso de comparar cinco medias poblacionales, si se tuvieran datos de cinco muestras pequeñas, se recurriría a una serie de diez pruebas de t para probar lo siguiente:
Ho1 : 1 = 2 Ho 2 : 1 = 3 Ho 3 : 1 = 4 Ho4 : 1 = 5 Ho5 : 2 = 3
Ho6 : 2 = 4 Ho7 : 2 = 5 Ho8 : 3 = 4Ho9 : 3 = 5 Ho10 : 4 = 5
Es claro que tales pruebas no son independientes entre sí, condición que impacta en la probabilidad del error tipo I global de modo que en realidad, cada prueba queda asociada a un valor i que es mayor al fijado, tanto más cuanto mayor sea el número de pruebas de la serie. Por ejemplo, si se fija un =0,05, los valores i cuando se comparan 3, 4 ó 5medias son igual, en correspondencia, a 0,14; 0,26 y 0,40
El análisis de la varianza, o resumidamente ADEVA o bien ANOVA (del inglés, analysis of variance), es una técnica que permite investigar simultáneamente k 3 medias poblaciones, mediante pruebas de hipótesis que toman la siguiente forma:
H0: 1 = 2 = … j=….= k ; j = 1, 2, …, k
H1: al menos una media es diferente
Esdecir, se prueba la hipótesis nula de que “todas las medias son iguales”, contrastada con la alternativa que postula “al menos una media es diferente”
Los datos a los que se aplica el análisis de la varianza, pueden provenir de estudios observacionales o bien de estudios experimentales. En el primer caso, los datos son las mediciones que corresponden a muestras aleatorias tomadas de laspoblaciones de interés sin modificar el estado de la naturaleza; en el segundo, los datos son las mediciones hechas en unidades experimentales que manifiestan la respuesta a cierto estímulo o tratamiento. Este segundo enfoque, se profundizará al desarrollar el tema diseño y análisis de experimentos.
El problema más sencillo de ADEVA es el que trataremos en esta oportunidad. Es el ADEVA declasificación única y modelo de efectos fijos.
14.2. NOTACIÓN EN EL ADEVA Y MATRIZ DE DATOS
En el análisis de la varianza se acostumbra a utilizar la letra Y para representar la variable aleatoria, además se utilizan dos subíndices (i, j) de modo que el primero indica a cual unidad de la muestra corresponde la posible medida y el segundo, a que población pertenece la muestra considerada. De este...
Regístrate para leer el documento completo.