estadistica
EXPLORATORIO
DE DATOS (AED)
Prof. Dra. L. Tauber
e-mail: estadisticabiologiafhuc@gmail.com
1
Análisis exploratorio de datos
Lo primero que debemos hacer con un conjunto de
datos es examinarlos para poder describir sus
características principales.
principales.
Este examen se llama análisis exploratorio de datos .
Se basa fundamentalmente en dos estrategias:estrategias:
• Comenzar con uno o varios gráficos de cada variable.
Luego continuar con medidas resúmenes de los
aspectos numéricos de los datos.
datos.
• Examinar cada variable de forma independiente.
independiente.
Luego,
Luego, pasar al estudio de las relaciones entre las
variables.
Prof. Dra. L. Tauber
e-mail: estadisticabiologiafhuc@gmail.com
2
Análisis exploratorio de los datos
“Elanálisis exploratorio de datos (AED) es:
es:
Organización,
Organización, sintesis y presentación de los datos;
datos;
un trabajo de detectives numéricos”.
numéricos”.
El AED no puede ser visto como el total de la
historia,
historia, pero sí puede ser visto como la piedra
fundamental; el primer paso”
paso”
John Tukey
Exploratory Data Analysis
Addison-Wesley, 1977
Prof. Dra.L. Tauber
e-mail: estadisticabiologiafhuc@gmail.com
3
Análisis exploratorio de los datos
Estas ideas de Tukey son las que deberíamos
tener en cuenta cuando tenemos un nuevo lote de
datos sobre el cual queremos sacar algún tipo de
conclusión.
El AED es un conjunto de técnicas
destinadas a procesar lotes de datos
con el fin de no agruparlos en
intervalos.
Prof. Dra. L. Taubere-mail: estadisticabiologiafhuc@gmail.com
4
Análisis exploratorio de los datos
El objetivo principal del AED es:
Detectar estructuras
Sugerir hipótesis
Facilitar un posterior análisis
confirmatorio
Prof. Dra. L. Tauber
e-mail: estadisticabiologiafhuc@gmail.com
5
CÓMO DETECTAR
ESTRUCTURAS
ALGUNAS CARACTERÍSTICAS QUE
DEBEMOS ANALIZAR PARA EXPLORAR
UNA DISTRIBUCIÓN
Prof.Dra. L. Tauber
e-mail: estadisticabiologiafhuc@gmail.com
6
CÓMO DETECTAR ESTRUCTURAS
Para describir el aspecto general de una
distribución,
distribución, se recomienda:
recomienda:
• Determinar su centro y su dispersión.
dispersión.
• Observar si la distribución tiene una forma simple,
simple,
que se pueda describir en pocas palabras. Para ello
palabras.
una de las cosas quese deben analizar es la
simetría.
simetría.
• Observar su forma: rectangular, U, acampanada, etc.
forma:
acampanada,
•Veamos cómo podemos hacerlo
Prof. Dra. L. Tauber
e-mail: estadisticabiologiafhuc@gmail.com
7
¿Qué podemos analizar a partir de
un gráfico? (Centro y dispersión)
• ¿Dónde se concentran o se centran los datos
sobre el eje horizontal, y cómo se dispersanalrededor del “centro”?
8
Interpretando gráficos: Forma
Simétrica, Unimodal (con un
solo “pico”) y Acampanada
Asimétrica a derecha: pocos
datos en los valores mayores
de la variable
Asimétrica a izquierda:
pocos datos en los valores
menores de la variable
Simétrica y Bimodal: dos
“picos”
Prof. Dra. L. Tauber
e-mail: estadisticabiologiafhuc@gmail.com
9
Interpretando gráficos:Valores atípicos
(“outliers”)
Sin valores
atípicos
Valor
atípico
• ¿Es usual encontrar valores atípicos o
alejados?
• Puede haber casos en los que se presenten
naturalmente y otros en los que se cometa
Prof. Dra. L. Tauber
10
algún error, como veremos en el sig. ejemplo
Ejemplo
• En un proceso de control de calidad se miden los diámetros de
una pieza hecha por una máquina (encm). El técnico anota 15
diámetros, pero no se da cuenta de que ha cometido un error de
escritura al anotar el segundo dato.
1,991 1,891 1,991 1,988 1,993 1,989 1,990 1,988
1,988 1,993 1,991 1,989 1,989 1,993 1,990 1,994
Diámetros
11
14/50
Describiendo
una
distribución
Frecuencias Relativas
Relative frequency
12/50
10/50
8/50
6/50
4/50
2/50
0
25
33
41
49...
Regístrate para leer el documento completo.