Estadística
T EMA 1.1
CURSO DE INTRODUCCIÓN A LA ESTADÍSTICA
Departament d’Estadística i Investigació Operativa
Universitat de València
ANÁLISIS EXPLORATORIO DE DATOS
Objetivo
Resumir, identificar, describir
Revela la estructura de los datos
Ayuda a elegir buenos métodos de inferencia
Las gráficas y los resúmenes numéricos
Dan una visión rápida delos datos
Destacan las características más importantes
Imprescindibles en presentaciones
Departament d'Estadística i Investigació Operativa.
CURSO DE INTRODUCCIÓN A LA ESTADÍSTICA
Departament d’Estadística i Investigació Operativa
Universitat de València
2
1
DATOS UNIVARIANTES Y MULTIVARIANTES
Univariantes
Medidas de una única variable sobre un conjunto de individuos Bivariantes
Medidas de 2 variables
Multivariantes
Medidas de varias variables
La descripción, gráfica y numérica, adecuada depende del tipo de
variable
Departament d'Estadística i Investigació Operativa.
3
TIPOS DE VARIABLES
Cualitativas o categóricas
No ordinales (no hay orden entre las categorías)
Sexo, Estado civil, Nacionalidad,…
Ordinales (hay unagradación entre las categorías)
Nivel educativo, Estado de salud, Consumo de alcohol,…
Cuantitativas o numéricas
Discretas (puede tomar un número finito de valores)
Nº de delitos en un fin de semana, Nº denuncias por maltratos en un mes,
Nº hijos,…
Continuas (dentro de un intervalo todos los valores son posibles)
Altura, Peso, Tasa de alcoholemia, Glucosa en sangre,…Departament d'Estadística i Investigació Operativa.
CURSO DE INTRODUCCIÓN A LA ESTADÍSTICA
Departament d’Estadística i Investigació Operativa
Universitat de València
4
2
VARIABLES CUALITATIVAS
DIAGRAMA DE BARRAS
Variable: Tipo de delito motivado por odio o prejuicio
4500
4000
Frecuencia Frecuencia
absoluta
relativa
55%
3919
Motivo
Racial
Religioso
1227
17%Orientación sexual
1017
14%
944
13%
53
1%
7160
100%
País de origen
Minusvalía
Total
3500
3000
2500
2000
1500
1000
500
0
Racial
Religioso
Orientación
sexual
País de
origen
Minusvalía
Moda: Nivel observado más frecuente
Departament d'Estadística i Investigació Operativa.
5
VARIABLES CUALITATIVAS
GRÁFICA DE SECTORES
13
1
Racial
14Religioso
Orientación sexual
55
País de origen
Minusvalía
17
Departament d'Estadística i Investigació Operativa.
CURSO DE INTRODUCCIÓN A LA ESTADÍSTICA
Departament d’Estadística i Investigació Operativa
Universitat de València
6
3
VARIABLES CUANTITATIVAS
Variable: Edad en la que cometieron el primer delito
17
27
19
21
23
22
16
18
19
7
13
21
25
3715
24
14
39
15
32
15
12
38
12
29
12
13
43
31
38
30
18
35
25
36
17
27
20
24
18
7
Departament d'Estadística i Investigació Operativa.
FRECUENCIAS AGRUPADAS
Hasta n=100 datos hay
que usar
intervalos
como referencia. Para
valores de n mayores no
deben usarse más de 20
intervalos.
Intervalos
Frecuencia
(5,10]
1
(10,15]
9
9(20,25]
8
(25,30]
4
(30,35]
3
(35,40]
•
•
•
•
(15,20]
5
(40,45]
1
Mínimo: 7
40
TOTAL
Máximo: 43
Como tenemos 40 datos, decidimos construir 8 intervalos
Amplitud =(43 – 7)/8 = 36/8=4.5
redondeado a 5
Departament d'Estadística i Investigació Operativa.
CURSO DE INTRODUCCIÓN A LA ESTADÍSTICA
Departament d’Estadística i Investigació OperativaUniversitat de València
8
4
HISTOGRAMA (8 INTERVALOS)
10
9
8
Frecuencia
7
6
5
4
3
2
1
0
10
15
20
25
30
35
40
45
Edad
9
Departament d'Estadística i Investigació Operativa.
6
LOS MISMOS DATOS EN OTROS
HISTOGRAMAS
20
18
5
16
14
4
12
3
10
8
2
6
4
1
2
0
8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44
Edad...
Regístrate para leer el documento completo.