Analisi Exploratori De Datos
ANALISIS
DE DATOS
LIC. ESPERANZA GARCIA CRIBILLEROS
2006
ENFOQUES DE ANALISIS
ENFOQUES
ESTADISTICO
Confirmatorio (Clásico)
Confirmatorio
Exploratorio (Tukey, 1977)
Exploratorio
COMPARACION DE LOS ENFOQUES DE
COMPARACION
ANALISIS (Bertrand)
EXPLOTARIO
Enfoque descriptivo
Enfoque
Indica las hipótesis a
Indica
probar
Usa estadísticos
Usa
Plan deinvestigación
Plan
flexible y poco definido
Usa los datos
Usa
disponibles
Privilegia la
Privilegia
representación gráfica.
Tiene visión intuitiva de
Tiene
los datos
Semeja una
Semeja
investigación policial.
CONFIRMATORIO
Enfoque inferencial
Enfoque
Prueba hipótesis
Prueba
Usa estadísticos
Usa
Plan de investigación
Plan
riguroso y bien definido.
Usa datos sin error
Usa(ideal).
Poca importancia a la
Poca
representación gráfica.
Tiene una visión precisa
Tiene
de los datos.
Semeja a un juicio
Semeja
Definición de análisis exploratorio
de datos:
Conjunto de herramientas estadísticas que
permiten una visualización previa al análisis
definitivo de los datos en estudio. Este análisis
tiene los siguientes objetivos:
Evaluar la calidad y laconsistencia de
Evaluar
los datos.
Determinar la distribución de las
Determinar
variables en estudio.
Aplicar el tratamiento de datos
Aplicar
ausentes.
Detectar datos atípicos (outliers).
Detectar
Comprobar supuestos: normalidad,
Comprobar
linealidad, homocedasticidad.
Resumir los datos mediante el uso conjunto
Resumir
de medidas de resumen y sus gráficos.
Explorar formas decategorizar variables a
Explorar
través de búsqueda de puntos de corte.
Ell análisis exploratorio de datos puede ser:
E
Univariado: Estatura, peso, pulso,
Univariado
temperatura, etc.
Bivariado: Estatura y peso, frecuencia
Bivariado
cardiaca y nivel de colesterol.
Multivariado: Se quiere medir la
Multivariado
relación entre la presión arterial,
edad, peso y estrés.
El análisisexploratorio de datos se
El
puede realizar en:
Forma de gráficos
Forma
Pruebas de contraste
Pruebas
ANÁLISIS EXPLORATORIO UNIVARIADO
AN
HISTOGRAMA:
Muestra la forma de distribución de
Muestra
los datos.
Revela la presencia o no de simetría
Revela
Proporciona información respecto a
Proporciona
la variabilidad de los datos.
Ejemplo:
Ejemplo:
Edades de un grupo de pacientes queparticiparon en un trabajo de
investigación.
1
20
34
41
48
57
2
23
34
42
48
57
3
24
34
42
49
57
4
25
34
42
49
57
5
25
34
42
49
57
6
26
35
43
50
58
7
26
35
43
50
58
8
28
36
43
51
58
9
28
36
44
52
59
10
29
36
44
52
59
11
30
37
44
53
60
12
30
37
44
53
60
13
30
37
45
54
61
14
30
38
45
55
62
1530
38
46
55
62
16
30
39
46
55
63
17
32
39
47
56
64
18
32
40
47
56
64
19
33
40
47
56
65
20
33
41
48
57
65
Histograma
Histograma y
curva normal
Asimetría
Asimetr
Identifica datos
extremos
Se observa
Se
simetría
Normalidad
Normalidad
Ausencia de
Ausencia
datos
extremos
Diagrama de tallo y hojas
Diagrama
Permite observaral conjunto de
datos como un todo y destacar
algunas características, tales como:
La simetría del conjunto de datos
La
La variabilidad de los datos
La
La presencia o no de “outliers”
La
Concentración de los datos
Concentraci
Brechas en el conjunto de datos
Brechas
Ejemplo: Se tienen las edades de 100 pacientes
que participaron en un estudio de investigación.
1
2
3
4
56
7
8
9 10 11 12 13 14 15 16 17 18 19 20
20 23 24 25 25 26 26 28 28 29 30 30 30 30 30 30 32 32 33 33
34 34 34 34 34 35 35 36 36 36 37 37 37 38 38 39 39 40 40 41
41 42 42 42 42 43 43 43 44 44 44 44 45 45 46 46 47 47 47 48
48 48 49 49 49 50 50 51 52 52 53 53 54 55 55 55 56 56 56 57
57 57 57 57 57 58 58 58 59 59 60 60 61 62 62 63 64 64 65 89
Diagrama de tallo y hojas en...
Regístrate para leer el documento completo.