Distribución t de student

Solo disponible en BuenasTareas
  • Páginas : 11 (2606 palabras )
  • Descarga(s) : 0
  • Publicado : 9 de diciembre de 2009
Leer documento completo
Vista previa del texto
Distribución t de Student.

Esta distribución fue publicada por primera vez en 1908 por William Sealy Gosset, que trabajaba en el departamento de fermentación de la cervecería Guinness en Irlanda. Las circunstancias en las que se llevan a cabo los procesos de fermentación en la producción de cerveza demostraron a Gosset las limitaciones de la teoría de muestras grandes y le enfatizaron lanecesidad de un método correcto para el tratamiento de muestras pequeñas. Estas circunstancias de su trabajo dirigieron a Gosset al descubrimiento de la distribución t, quien debido a que la compañía cervecera desaprobaba la publicación de investigaciones de sus empleados, la publicó con el seudónimo de "student".

Gossett se interesó en el comportamiento del valor ¨z¨ cuando se utilizaba ¨s¨ en vez de¨σ¨, y particularmente en la discrepancia entre ¨s¨ y ¨σ¨ cuando ¨s¨ se calcula de muestras muy pequeñas.

De acuerdo al Teorema del Límite Central, la distribución muestral de una estadística (como la media de la muestra) seguirá una distribución normal, siempre y cuando el tamaño de la muestra sea suficientemente grande.

Entonces cuando conocemos la desviación estándar de la población podemoscalcular un valor o calificación ¨z¨ y emplear la distribución normal para evaluar probabilidades sobre la media de la muestra.

Sin embargo, muchas veces los tamaños de las muestras son muy pequeños, y frecuentemente no conocemos la desviación estándar de la población. Cuando estos problemas ocurren, en estadística se recurre a una distribución conocida como la “t de student” cuyos valores estándados por:

En donde es la diferencia a probar, y es la desviación estándar de la diferencia.

Podemos ver que la ecuaciones prácticamente igual a la utilizada para la distribución muestral de medias, pero reemplazando la desviación estándar de la población por la desviación estándar de la muestra.

De manera similar al caso de la distribución muestral de medias para el caso de que n > 30, endonde usamos la distribución normal, podemos encontrar la distribución de los valores t de student para aquellos casos cuando n < 30.

Sin embargo, otra diferencia en su uso es el empleo de tablas de distribución para valores ¨t¨ en lugar de las tablas para valor ¨Z¨.

Para derivar la ecuación de esta distribución, Gosset supuso que las muestras se seleccionan de una población normal. Aunque estoparecería una suposición muy restrictiva, se puede mostrar que las poblaciones no normales que poseen distribuciones en forma casi de campana también proporcionan valores de ¨t¨ que se aproximan muy de cerca a la distribución t.

La distribución t difiere de la de ¨Z¨ en que la varianza de ¨t¨ no es igual a 1 como en la de ¨Z¨, sino que depende del tamaño de la muestra y siempre es mayor a uno.Únicamente cuando el tamaño de la muestra tiende a infinito las dos distribuciones serán las mismas.

Otra diferencia con la distribución normal, es que la forma de la distribución t de student depende de un parámetro llamado el número de grados de libertad.

El número de grados de libertad es igual al tamaño de la muestra (número de observaciones independientes) menos 1.

gl = v = n-1

Las curvasmuestran la forma que puede tomar la distribución t de student la cual depende del número de grados de libertad. Como se puede apreciar se parece mucho a la distribución normal. Incluso, para un número grande de grados de libertad (es decir de número de datos en la muestra) las dos distribuciones son iguales.

Aunque parece una distribución normal, la distribución t tiene un poco más de área en losextremos y menos en el centro.

Otro punto a notar es que la distribución t es más bien una colección de distribuciones, una para cada número de grados de libertad.

El concepto de grados de libertad se puede visualizar haciendo referencia a la varianza muestral que es igual a:

Esta fórmula puede verse como un promedio sobre n-1 datos.

La terminología de grados de libertad resulta del hecho...
tracking img