Estadistica Descriptiva
por
Claudia Jiménez R.
Universidad Nacional
27/02/2014
CLAUDIA JIMÉNEZ R, UNIVERSIDAD NACIONAL DE COLOMBIA
1
Objetivos del análisis exploratorio y
descriptivo
Los investigadores usan la estadística descriptiva
para resumir los datos con el objeto de lograr una
mejor comprensión de las tendencias generales o
patrones descubiertos en la exploración de los datos.27/02/2014
CLAUDIA JIMÉNEZ R, UNIVERSIDAD NACIONAL DE COLOMBIA
2
Medidas de tendencia central
Las medidas de tendencia central permiten generalizar una característica de
interés de una población. Sirve como estimación del prototipo del conjunto de
datos completo (población) pues dan una idea de lo típico o común.
parámetro poblaciona l que representa lo más común o típico
Media aritmética
Mediana
Moda
Datos u observaciones
en la muestra
Media recortada
Media geométrica
27/02/2014
CLAUDIA JIMÉNEZ R, UNIVERSIDAD NACIONAL DE COLOMBIA
3
La media aritmética (mean)
En términos físicos, la media representa el centro de gravedad de un
conjunto de datos.
Ejemplo: Se registra el número de tazas de café consumidas por un
empleado de oficina en un período de 20 días. Los datos son: 4,5,
3, 6, 7, 1, 2, 3, 0, 5, 6, 5, 8, 4, 0, 2, 3, 7, 5, 6. De aquí tenemos que,
en promedio, este empleado consume 4.1 tazas de café diarias. El
siguiente gráfico de puntos ilustra esta afirmación.
27/02/2014
CLAUDIA JIMÉNEZ R, UNIVERSIDAD NACIONAL DE COLOMBIA
4
La mediana (median)
Si las observaciones se ordenan de menor a mayor, la mediana
representa aquel valor que divide los datos en dospartes iguales.
De esta manera el 50% de los datos son inferiores o iguales a la
mediana y el otro 50% es mayor que esa cantidad. Si denotamos
la mediana por Me, tenemos que: X 1 ≤ X 2 ≤ ≤ X n
En el ejemplo anterior, si ordenamos los datos: 0, 0, 1, 2, 2, 3, 3, 3,
4, 4, 5, 5, 5, 5, 6, 6, 6, 7, 7, 8. Como n es par:
Me = 4.5 tazas de café
27/02/2014
CLAUDIA JIMÉNEZ R, UNIVERSIDAD NACIONAL DECOLOMBIA
5
La moda (mode)
Representa aquel valor que más se repite o que tiene mayor
frecuencia.
Es útil para representar el prototipo de un conjunto de datos
cualitativos o discretos, pero también es aplicable a datos
continuos. En este último caso representa un pico en la distribución.
En el ejemplo 0, 0, 1, 2, 2, 3, 3, 3, 4, 4, 5, 5, 5, 5, 6, 6, 6, 7, 7, 8
Moda = 5
27/02/2014
CLAUDIA JIMÉNEZR, UNIVERSIDAD NACIONAL DE COLOMBIA
6
La media geométrica (geometric mean)
La media geométrica es la raíz n-ésima del producto de todos los
datos:
Por ejemplo, la media geométrica de 2 y 18 es:
2
2 18 6
Otro ejemplo, la media geométrica de 2, 3 y 18 sería:
3
2 3 18
Sólo es aplicable la media geométrica cuando los números son
positivos. La media geométrica es útil cuando variascantidades son
multiplicadas para producir un total.
27/02/2014
7
Comparaciones con datos atípicos
Sea m = (1, 1, 1, 1, 1, 1,100)
Estadística
27/02/2014
Estimación
Media geométrica
1.93
Media aritmética
15.14
Mediana
1.00
Media recortada al 25%
1.00
CLAUDIA JIMÉNEZ R, UNIVERSIDAD NACIONAL DE COLOMBIA
8
Características de las estadísticas
de tendencia central
Media
o Posee propiedadesestadísticas deseables pero es
sensible a los valores extremos (no robusta).
Moda
o Apropiada para datos de tipo nominal.
Mediana
Requiere el ordenamiento de los datos.
27/02/2014
CLAUDIA JIMÉNEZ R, UNIVERSIDAD NACIONAL DE COLOMBIA
9
Medidas de la dispersión de los
datos
Sirven para informar cómo están de lejos o
cercanos los datos individuales en el espacio.
Generalmente son aplicables adatos de tipo
cuantitativo.
27/02/2014
CLAUDIA JIMÉNEZ R, UNIVERSIDAD NACIONAL DE COLOMBIA
10
El rango (range)
El recorrido, rango o amplitud es la diferencia entre el mayor y el
menor valor de la variable.
Rango = Max –Min
Un valor pequeño del recorrido indica poca dispersión, puesto
que la variable toma valores en un intervalo pequeño. Un valor
grande en los datos puede indicar mucha...
Regístrate para leer el documento completo.