DataWareHouse
ESCUELA DE SISTEMAS
Trabajo Final de Data Warehouse y Data Mining:
Creaci´
on de un Datawarehouse usando la
Metodolog´ıa Hefesto y An´
alisis de datos mediante
WEKA: Predicci´
on, clasificaci´
on, clustering y
asociaci´
on
Realizado por: Juan Carlos Lojano U.
Profesor:
Ing. V´ıctor Saquicela
´Indice general
Lista de figuras
5
Lista de tablas
7
1. Introducci´
on1.1. Problema planteado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2. Descripci´on de los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
1
1
2. M. Hefeso
2.1. An´alisis de requerimientos . . . . . . . . . . . . . . .
2.1.1. Identificar preguntas. Accidentes de carretera
2.1.2. Identificar indicadores y perspectivas. . . . . .
2.1.3. Modelo Conceptual . . . . .. . . . . . . . . .
2.2. An´alisis de los OLTP . . . . . . . . . . . . . . . . . .
2.2.1. Conformar Indicadores . . . . . . . . . . . . .
2.2.2. Establecer Correspondencias . . . . . . . . . .
2.2.3. Nivel de Granularidad . . . . . . . . . . . . .
2.2.4. Modelo Conceptual Ampliado . . . . . . . . .
2.3. Modelo L´ogico del DW . . . . . . . . . . . . . . . . .
2.3.1. Tipo de Modelo L´ogico del DW .. . . . . . .
2.3.2. Tablas de dimensiones . . . . . . . . . . . . .
2.3.3. Tablas de hechos . . . . . . . . . . . . . . . .
2.3.4. Uniones . . . . . . . . . . . . . . . . . . . . .
2.4. Integraci´on de Datos . . . . . . . . . . . . . . . . . .
2.4.1. Carga Inicial . . . . . . . . . . . . . . . . . .
2.4.2. Actualizaci´on . . . . . . . . . . . . . . . . . .
2.4.3. Creaci´on de cubosmultidimensionales . . . . .
2.4.4. Resultados . . . . . . . . . . . . . . . . . . . .
3. Miner´ıa de Datos
3.1. Introducci´on . .
3.2. Objetivos . . .
3.3. Problem´atia . .
3.4. Predicci´on . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
..
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
..
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5
5
5
6
8
9
9
12
16
18
18
18
18
24
25
26
26
28
29
31
.
.
.
.
35
35
35
36
36
´INDICE GENERAL
´INDICE GENERAL
3.4.1.
3.4.2.
3.4.3.
3.4.4.
3.4.5.
3.4.6.
Marco Te´orico . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Definici´on del problema .. . . . . . . . . . . . . . . . . . . . . .
Obtenci´on de los datos para el an´alisis . . . . . . . . . . . . . . .
Elecci´on del algoritmo para el an´alisis de los datos . . . . . . . . .
Aplicaci´on de los algoritmos a los datos . . . . . . . . . . . . . . .
Selecci´on del modelo en base al MAPE (Mean Absolute Percentage
Error) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3.4.7. An´alisis de resultados . . . . . . . . . . . . . . . . . . . . . . . . .
3.5. Clasificaci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.5.1. Marco Te´orico . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.5.2. Definici´on del problema . . . . . . . . . . . . . . . . . . . . . . .
3.5.3. Obtenci´on de los datos para el an´alisis . . . . . . . . . . . . .. .
3.5.4. Elecci´on del algoritmo para el an´alisis de los datos . . . . . . . . .
3.5.5. Aplicaci´on del algoritmo a los datos . . . . . . . . . . . . . . . . .
3.5.6. Selecci´on del modelo en base al MAE (Mean Absolute Error) . . .
3.5.7. An´alisis de resultados . . . . . . . . . . . . . . . . . . . . . . . . .
3.6. Clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ....
Regístrate para leer el documento completo.