Medidad de dispercion
Medidas De Dispersion
Las medidas de tendencia central tienen como objetivo sintetizar los datos en un valor representativo,
las medidas de dispersión nos dicen hasta que punto estas medias son representativas como síntesis de
la información.
Estas medidas indicarán por un lado el grado de variabilidad que hay en la muestra y, por otro, larepresentatividad de dicho punto central, ya que si se obtiene un valor pequeño, eso significa que los
valores se concentran en torno a ese centro (por lo que habrá poca variabilidad y el centro representará
bien a todos). En cambio, si se obtiene un valor grande, significa que los valores no están concentrados,
sino dispersos (por lo que habrá mucha variabilidad y el centro no será muyrepresentativo). Se tomará
como punto central de referencia la media aritmética, aunque de
forma análoga podría utilizarse la mediana.
En primer lugar se buscará una forma de medir la dispersión en términos absolutos ( Dependiendo de
las unidades en las que se mida la variable).
Matemáticamente la distancia de un valor a otro es la diferencia entre esos valores sin signo, es decir,
en valor absoluto.Sin embargo, el valor absoluto tiene muy malas propiedades matemáticas. En
cambio, si se elevan las distancias al cuadrado, también “se quita” el signo y eso sí que tiene buenas
propiedades matemáticas. Así surge la varianza, que sirve igualmente para medir la dispersión
conjunta en torno a la media, pero es más operativa. El resultado se mide en unidades al cuadrado y es
difícil deinterpretar,por ló que lo habitual es calcular su raíz cuadrada (y surge así lo que se llama
desviación típica o estándar).
RANGO. O recorrido, es el intervalo de mayor tamaño que contiene a los datos, se obtiene restando al valor
máximo de los datos el valor mínimo. Esta medida muestra la dispersión total en un conjunto de datos. Se
consideran solo los valores extremos de una serie de datos.
R =Valor máximo- valor mínimo
RANGO INTERCUERTILICO. Esta medida de dispersión se obtiene de la diferencia entre el Q3 y el Q1. Estos
últimos son medidas de posición de los datos.
RINTERCUARTILICOQ3 Q1
RANGO SEMINTERCUARTILICO. Es el intervalo de los datos que se obtiene promediando la diferencia entre el
cuartil 3 y el cuartil 1.
Q Q1
RSEMIINTERCUARTILICO 3
2
RANGO INTERPERCENTILICO.Es la diferencia entre los percentiles 90 y 10, los cuales se consideran como los
extremos de los datos.
CETIS79
APUNTES DE PROBABILIDADF Y ESTADISTICA
Ing.
Leticia Castillo Jiménez
RPERCENTIL.1090 P90 P10
La desventaja de estas medidas de dispersión es que no dan información sobre la conformación o distribución de
los datos entre estos valores extremos.
DESVIACION MEDIA.La desviación media, D.M.., es un promedio de los valores absolutos de las desviaciones, de cada elemento, xi,
de la distribución respecto a su media,
n
x i x x1 x x 2 x x 3 x ... x n x
D.M=
n
x
i 1
i
x
n
Ejemplo:
Calcular la desviación media de la distribución: 9, 3, 8, 8, 9, 8, 9, 18
Se calcula la media aritmética
x
D.M .
9 3 8 8 9 8 18
9
8
9 9 3 9 8 9 8 9 9 9 8 9 9 9 9 18
8
2.25
DESVIACION ESTANDAR. La desviación estándar de una serie de números X1, X2,…, Xn se representa por
“S” y se define por:
S
N
X
i 1
X
N
2
I
Ejemplo: Hallar la desviación estándar de los siguientes datos:
12, 6, 7, 3, 15, 10,18, 5.
Xi
Xi X
X i X 2
12
6
7
3
15
10
18
5
2.5
-3.5
-2.5
-6.5
5.5
0.5
8.5
-4.5
6.25
12.25
6.25
42.25
30.25
0.25
72.25
20.25
190.00
X
S
76
8
9 .5
190
8
4.87
Si X1, X2, …, XN se presentan con frecuencias f1, f2, …, fN entonces tendremos:
CETIS79
Ing.
APUNTES DE PROBABILIDADF Y ESTADISTICA
S
N
i 1
...
Regístrate para leer el documento completo.