Tema5 Medidas_de_dispersion_y_asimetria 1
Medidas de Variabilidad y
asimetría
INTRODUCCION
El conocimiento de las medidas de centralización no es
suficiente
para
caracterizar
completamente
a
una
distribución.
Para hacer una descripción más precisa de los conjuntos de
datos y para hacer comparaciones válidas, sin llegar a
conclusiones engañosas, es importante tomar en cuenta
Las
medidas de
o de dispersióncuantifican
el
la variación
de variabilidad
los datos alrededor
de un valor
central.
grado de concentración o de dispersión (separación) de los
datos alrededor de un valor central (promedio), permitiendo:
oJuzgar la confiabilidad ó significancia de dicha medidas de
tendencia central.
oComparar la dispersión de diversos conjuntos de datos ó
muestras.
Observación: Cuando la dispersión es muy grande(heterogeneidad), la media aritmética no tiene mucha
significación; sin embargo, a medida que la dispersión se
hace más baja (homogeneidad), la media adquiere mayor
Medidas de dispersión o de variabilidad
0.3
60
50
0.2
40
30
0.1
20
10
0.0
0
0
10
20
30
40
Dos distribuciones de
datos con diferentes
medidas
de
variabilidad pero con
la misma medida de
posición.
0
4
8
12
16
20
Tresdistribuciones de
datos con diferentes
medidas de variabilidad
y de posición.
MEDIDAS DE DISPERSIÓN
De manera que una de las características
importantes en el análisis de los datos, además de
los promedios, es la DISPERSIÓN ó VARIABILIDAD.
La dispersión es la cantidad de variación,
desperdigamiento o diseminación en los datos en
torno al promedio.
Las medidas de Dispersión más usadas son:
i.Rango
R
ii. Rango intercuartil
RIQ
iii. Varianza
S2 ó V(x)
iv. Desviación estándar
S
v. Coeficiente de variación
CV(X)
Medidas de dispersión
Amplitud o Rango
La diferencia ó distancia entre las
observaciones extremas:
R = XMáx – XMín
2,1,4,3,8,4. El rango es 8-1 = 7
Es muy sensible a los valores extremos.
Rango intercuartílico
Es la distancia entre el primer y tercer cuartil.
Rangointercuartílico =Q3–Q1=P75–P25
Parecida al rango, pero eliminando el
25% de las observaciones más extremas
inferiores y superiores.
Como
seafectada
puede por
observar,
este
indicador
No es
los valores
extremos.
25
%
% % 5%
25 25
2
informa sobre
de la dispersión que hay en el 50% central de la
distribución.
Varianza (S2)
Mide el promedio de las desviaciones (al cuadrado) de lasobservaciones con
respecto a la media. Es una medida absoluta de variabilidad, más estable que
el rango. Su cálculo puede hacerse a partir de:
I. Datos no tabulados (originales), la varianza se calcula a partir de:
2
__ 2
X
X
2
i
X
n X
2
i 1
S
n1
n1
n
__
Es sensible a valores extremos (alejados de la
media).
o Sus unidades son el cuadrado de las de la
Desviación estándar (S)variable.
Es una medida cuya interpretación es mas
sencilla, pues tiene las mismas unidades que la
variable. Se calcula a partir de la varianza.
o
S Varianza
Ejemplo:
Calcular la varianza de los siguientes
valores numéricos:
5, 9, 11, 7
• Primero calculamos
5 9 11el
7promedio
x
8
4
2
2
2
2
• Entonces
la
varianza
será
(5
8)
(9
8)
(11
8)
(7
8)
9 1 9 1
S2
6.667
3
3• Utilizando la fórmula simplificada:
2
2
2
2
2
(5
9
11
7
)
4(8)
S2
6.667
3
II. Datos tabulados:
A. Si la variable es discreta, se calcula a partir de:
k
2 * f nX 2
X
j
j
j
1
S2
n 1
Donde:
xj : Es el valor de la observación en la clase
fj : Es la frecuencia absoluta simple
n : Tamaño de la muestra (número de datos
considerados)
B. Si la variable es continua (datosagrupados en
intervalos de clase), la fórmula es la misma, pero el
valor de Xj es elk punto
medio
2 o marca de clase Mj,
2
X j * f j nX
de modo que:
2 j 1
S
Xj Mj
n 1
L j L j 1
2
Ejemplo:
Calcular la varianza
del número de hijos
por Número
familia.
de hijos
0
1
2
3
4
5
6
7
fj
5
16
21
17
12
8
5
1
Calcular la varianza
para los siguientes
gastos en publicidad
de diferentes
Gasto de...
Regístrate para leer el documento completo.