La Chi Cuadrada
Origen y autor
El matemático inglés Karl Pearson (1857−1936), con formación en literatura medieval alemana, derecho romano, física, biología y teoría política del socialismo, hasta 1890 sobresalió por aplicar ampliamente la Estadística y la Teoría de la Probabilidad a la solución de diferentes problemas de la ingeniería industrial, tales como determinar la resistencia, lafuerza o la durabilidad de aleaciones, resortes, engranajes, materias primas, etc.; pero luego él terminó involucrado en las investigaciones biológicas del zoólogo Walter Weldon y en las investigaciones sobre antropometría, eugenesia y evolución humana realizadas por Francis Galton que requerían la elaboración de cálculos muy precisos para la cuantificación de los resultados obtenidos.
De este modo,como protegido de Francis Galton e influenciado por sus ideas sobre la eugenesia para perfeccionar científicamente el patrimonio genético de la especie humana, Pearson también comenzó a aplicar la Estadística y la Teoría de la Probabilidad en campos biológicos muy variados: como la valoración matemática de las muestras clínicas usadas en la inmunología, la valoración de los resultadosbiométricos, el cálculo de los chances de sobrevivencia de una especie frente a otras, el cálculo de la probabilidad de transmisión hereditaria de una característica genética favorable, la elaboración de tablas para calcular el grado de expansión entre la población de ciertas «taras» consideradas indeseables (retraso mental, albinismo, sordera, ceguera, tartamudez, alcoholismo, homosexualidad, etc.), elcálculo de la correlación existente entre las características biológicas de los padres y las características heredadas por sus hijos, la propuesta de nuevos métodos para la cuantificación y la codificación de la información estadística recolectada respecto de las características físicas y mentales de los bebés que nacen anualmente en una nación, etc.
A través de estas numerosas investigaciones Pearsonaxiomatizó los conceptos de Regresión Lineal y de Coeficiente de Correlación que inicialmente fueron sugeridos por Galton, pero además, ante la necesidad de establecer parámetros más exactos y objetivos para determinar cuándo la desviación estadística de un resultado obtenido respecto del resultado esperado en un experimento es verdaderamente significativa, hacia 1900 Pearson propuso lo queactualmente se conoce como el «Test Chi Cuadrado» asociado a la «Distribución Chi Cuadrado», que es una prueba que se le aplica a los valores estadísticos resultantes de un experimento para determinar cuál es el grado de confianza que se le puede atribuir a la creencia de que la desviación descubierta en los resultados obtenidos realmente se aleja del comportamiento regularmente esperado del fenómeno.Descripción
El test de chi-cuadrado es únicamente para las leyes discretas, pero se puede utilizar también para muestras continuas agrupadas en clases. El caso típico es, como siempre, el de una muestra de una ley desconocida. Las clases, denotadas , son una partición del conjunto de los valores posibles. La hipótesis a comprobar tiene que ver con las probabilidades de las clases, para lascuales se toman valores teóricos .
Bajo la hipótesis, la distribución empírica de la muestra sobre las clases debe estar cerca de la distribución teórica. La distribución empírica es la de las frecuencias de la muestra en las clases:
Se mide el ajuste de la distribución empírica a la distribución teórica por la distancia de chi-cuadrado.
Definición 2.3 Se llama distancia dechi-cuadrado de con respecto a , y se denota por , al valor:
La ''distancia'' de chi-cuadrado es por tanto una media ponderada de las diferencias cuadráticas entre los valores de y . No es una distancia en el sentido usual del término, pues ni siquiera es simétrica. La ley de probabilidad de no tiene una expresión explícita en general. Se emplea entonces el siguiente resultado.
Teorema 2.4 Bajo...
Regístrate para leer el documento completo.