INFORMATICA
11. FUNCIONES DE DISTRIBUCIÓN ESPECIALES
DISTRIBUCIÓN CHI2 CUADRADO DE PEARSON
Si (X1,X2,...,Xn) son n variables aleatorias normales independientes de media 0 y varianza 1, la variable definida como
se dice que tiene una distribución CHI con n grados de libertad. Su función de densidad es
siendo la función gamma de Euler, con P>0. La función de distribución viene dada porLa media de esta distribución es E(X)=n y su varianza V(X)=2n. Esta distribución es básica en un determinado número de pruebas no paramétricas.
Si consideramos una variable aleatoria Z~N(0,1), la variable aleatoria X=Z2 se distribuye según una ley de probabilidad distribución CHI con un grado de libertad
Si tenemos n variable aleatoria independientes Zi~N(0,1), la suma de sus cuadradosrespectivos es una distribución CHI con n grados de libertad,
La media y varianza de esta variable son respectivamente, E(X)=n y V(X)=2n
Ejemplo, El espesor de un semiconductor se controla mediante la variación estándar no mayor a =0.60 mm. Para mantener controlado el proceso se toman muestras aleatoriamente de tamaño de 20 unidades, y se considera que el sistema está fuera de controlcuando la probabilidad de que 2 tome valor mayor o igual al valor de la muestra observado es que es 0.01. Que se puede concluir si s=0.84mm?
Solución. Existe fuera de control si con n=20 y =0.60, excede
Entonces,
Por tanto, el sistema está fuera de control
La función de distribución CHI tienen importantes variaciones de acuerdo con los grados de libertad y del tamaño muestral (menortamaño muestral y mayor tamaño muestral respectivamente),
En consecuencia, si tenemos X1,..,Xn, variable aleatoria independientes, donde cada
, se tiene
La distribución Chi muestra su importancia cuando queremos determinar la variabilidad (sin signo) de cantidades que se distribuyen en torno a un valor central siguiendo un mecanismo normal.
Teorema (Cochran). Sean X1,…,Xn condistribución N(,), la variable aleatoria independiente, entonces
La función Chi-cuadrado es igual a la función normal elevada al cuadrado. Esto es, el producto de dos distribuciones de Gauss es una distribución de Chi-cuadrado. Si de una población normal, o aproximadamente normal, se extraen muestras aleatorias e independientes, y se le calcula el estadígrafo χ2 usando el valor muestralde la varianza y el poblacional con:
Esta función matemática está caracterizada por el valor del número de grados de libertad υ=n-1 (donde n es el tamaño muestral). Al igual que la t-Student, el valor total del área bajo la curva es igual a la unidad, pero la diferencia principal es que esta no es simétrica respecto al origen, sino que se extiende desde 0 hasta + ∞ porque no puede sernegativa.
A medida que los grados de libertad aumentan, la curva cambia de forma y sus valores se han tabulado en el anexo de tablas estadísticas, donde se muestran los valores del área bajo la curva, para los principales valores de χ2, a la derecha de éste. O sea, se muestra la zona de rechazo para diferentes niveles de significación y de grados de libertad, lo cuales varían entre 1 y 100. Másallá, conviene usar directamente la función de Gauss.
Para cada grado de libertad hay una tabla de valores que pueden obtenerse variando el nivel de significación, parecida a la de Gauss. El problema de calcular los valores críticos, para un nivel de confianza dado, se resuelve de dos maneras: usando computadoras para resolver los cálculos, y la otra más común, usando tablas resumidas, en formaanáloga a la vista para el modelo de t-Student. La distribución de χ2 se usa principalmente para analizar dispersiones. Se compara la dispersión muestral expresada a través de sus cuadrados medios contra la dispersión poblacional cuantificada a través de la varianza (σ2).
Existen otros criterios, como el de Thonks, que usa un error relativo admisible máximo, y se calcula como un cuarto del...
Regístrate para leer el documento completo.