Panaderia
Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo. Las medidas de dispersión nos dicen hasta qué punto estas medidas de tendencia central, son representativas como síntesis de la información. Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la distribuciónrespecto al valor central. Distinguimos entre medidas de dispersión absolutas, que no son comparables entre diferentes muestras y las relativas que nos permitirán comparar varias muestras.
SÍMBOLOS
σ 2 = Varianza poblacional σ = Desviación estándar o desviación típica poblacional. S2 = Varianza muestral
S = Desviación estándar o desviación típica muestral CV = Coeficiente de Variación Cuando se dio el ejemplo de la media para datos sin agrupar, se tenía un grupo de personas, en donde la edad promedio es de 20 años y este promedio se puede ver enCV =grupos de personas. dos Coeficiente de Variación 18 19 20 21 22 (Grupo A)
4 5 6 65
(Grupo B)
Aunque la media de los dos grupos es igual, si se observa la distancia que hay entre los datos del primer grupo A, con respecto ala media, se puede decir que entre 18 y 20 hay 2 unidades entre 19 y 20 1 unidad etc. Para el segundo grupo, el B, las diferencias son entre 4 y 20, 16 unidades, entre 5 y 20 15 unidades etc. Quiere decir que las distancias que hay de los datos del segundo grupo con respecto al primero son mayores que las del primero. Esta situación nos indica que una medida de tendencia central no es suficientepara la descripción completa de una serie de datos. Entonces existe la necesidad de encontrar una
Guía de clase Módulo Estadística I Patricia Castillo Garzón 2009 1
medida que mida la distancia, variación o dispersión de los datos con respecto a la media.
Las medidas de dispersión son aquellas que determinan cómo se agrupan o se dispersan los datos alrededor de un promedio. Las principales medidas son el rango, la varianza, la desviación estándar y el coeficiente de variación.
PARA VARIABLES CUANTITATIVAS
ABSOLUTAS • • • Rango Varianza Desviación estándar
RELATIVAS • Coeficiente de variación
2.4.2.1 El Rango
La medida más simple de dispersión es el rango. Esta medida se conoce también como recorrido o amplitud ycomo se vio en los pasos para elaborar una tabla de frecuencias, es la diferencia entre el valor más alto y el más pequeño. Aunque es la medida de dispersión más sencilla de calcular, no es muy usual su empleo, pues no considera las variaciones de valores intermedios y es muy sensible a los valores extremos. Se simboliza con la letra R. El rango de las edades en el grupo A es: R = 22 - 18 = 4
Guía de clase Módulo Estadística I Patricia Castillo Garzón 2009 2
Significa que la diferencia entre la edad de la persona de mayor edad, con respecto a la menor, es de 4 años. Para el grupo B el rango es: R = 65 – 4 = 61 La diferencia entre la edad de la persona mayor con respecto a la menor es de 61 años. En el segundo ejemplo se ve que aunque el rango essencillo de calcular, tiene la desventaja de que es sensible a los valores extremos.
2.4.2.2. La Varianza
De todas las medidas de dispersión, la más importante, más conocida y usada es la varianza. Se define como la media aritmética de los cuadrados de las desviaciones, respecto a su media.
SIMBOLO
σ 2 = Varianza poblacional
2.4.2.2.1 Datos sin agrupar
Por definición la varianza es igualal promedio de las desviaciones al cuadrado, esto lo expresamos en la siguiente fórmula:
S 2 = Varianza muestral
σ2 =
Ejemplo con los datos del grupo A: (X : edad) 18 19 20 21 22
Guía de clase Módulo Estadística I Patricia Castillo Garzón 2009 3
σ2 =
σ2 = σ2 = 2
La varianza es igual a 2 años2 Observamos que al elevar al cuadrado la suma...
Regístrate para leer el documento completo.