Probabilidad
MEDIDAS DE DISPERSIÓN PARA DATOS AGRUPADOS Y SIN AGRUPAR
Una vez localizado el centro de la distribución de un conjunto de datos, el siguiente paso es buscar una medida de la variabilidad o dispersión de los datos; como se mencionó anteriormente, las medidas de tendencia central tienen como objetivo sintetizar los datos en un valor representativo; como complemento,las medidas de dispersión nos dicen que tan representativas son estas medidas de tendencia central como síntesis de la información; de esta manera, las medidas de dispersión cuantifican la separación, dispersión, la variabilidad de los valores de la distribución respecto al valor central como la media aritmética. Cuanto menor es la dispersión, tanto mayor será la precisión del sistema demedición. Si los estadígrafos de posición se relacionan con el concepto de exactitud, los de dispersión se relacionan con la precisión de las técnicas. La dispersión es importante porque: • Proporciona información adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la posición central es menos representativa de los datos. • Yaque existen problemas característicos para datos ampliamente dispersos, debemos ser capaces de identificarlos antes de abordar esos problemas. • Quizá se desee comparar las dispersiones de diferentes muestras. Si no se desea tener una amplia dispersión de valores con respecto al centro de distribución o esto presenta riesgos inaceptables, necesitamos tener habilidad de reconocerlo y evitar escogerdistribuciones que tengan las dispersiones más grandes. Ya que la dispersión ocurre frecuentemente y su grado de variabilidad es importante, ¿cómo medimos la variabilidad de una distribución empírica? Vamos a considerar sólo algunas medidas de dispersión: el rango, el rango inter-cuartílico, la varianza, la desviación estándar y el coeficiente de variación.
Medidas de Dispersión
EL RANGO ORECORRIDO ( R ):
Es la medida de variabilidad más fácil de calcular. Para datos finitos o sin agrupar, el rango se define como la diferencia entre el máximo valor (Xn ó XMax) y el mínimo (X1 ó XMin) en un conjunto de datos, de manera más formal: R = XMáx – XMín = Xn - X1 Ejemplo: Se tienen las edades de cinco estudiantes universitarios de 1er año, a saber: 18,23, 27,34 y 25., para calcular elrango o recorrido de la variable, se tiene que: R = Xn – X1 = 34 – 18 = 16 años
Rango para datos agrupados
Con datos agrupados no se saben los valores máximos y mínimos. Si no hay intervalos de clases abiertos podemos aproximar el rango mediante el uso de los límites de clases. Se aproxima el rango tomando el límite superior de la última clase menos el límite inferior de la primera clase, demanera más formal: R= (lim. Sup. de la clase n – lim. Inf. de la clase 1) Ejemplo: Dada la siguiente distribución de frecuencia determinar el rango o recorrido:
Clases P.M. mi 14,628 29,043 43,458 57,873 72,288 86,703 ni fi Ni Fi
7,420 – 21,835 21,835 – 36,250 36,250 – 50,665 50,665 – 65,080 65,080 – 79,495 79,495 – 93,910 Total
10 4 5 3 3 5 30
0,33 0,13 0,17 0,10 0,10 0,17 1,00
10 14 1922 25 30
0,33 0,46 0,63 0,73 0,83 1,00
Página 2 de 18
Medidas de Dispersión
El rango de la distribución de frecuencias se calcula así: R = (lim. Sup. de la clase n – lim. Inf. De la clase 1) = (93.910 – 7.420) = 86.49
Propiedades del Rango o Recorrido:
• El recorrido es la medida de dispersión más sencilla de calcular e interpretar puesto que simplemente es la distancia entre losvalores extremos (máximo y mínimo) en una distribución. • Puesto que el recorrido se basa en los valores extremos, éste tiende a ser errático. No es extraño que en una distribución de datos económicos o comerciales incluya a unos pocos valores en extremo pequeños o grandes. Cuando tal cosa sucede, entonces el recorrido solamente mide la dispersión con respecto a esos valores anormales,...
Regístrate para leer el documento completo.