Ingeniero De Sistemas
Datawarehouse
Construcción de un Data Warehouse
Fundamentos
CARRERA DE
INGENIERÍA DE SISTEMAS
Agenda
● ●
DATAWAREHOUSE
Diseño de un almacen de datos. Pasos para el diseño de un almacen de datos
–
Modelamiento multidimensional.
CARRERA DE
INGENIERÍA DE SISTEMAS
Diseño de un Almacén de Datos
Recogida y análisis de requisitos
DATAWAREHOUSEDiseño conceptual
Diseño lógico específico
Diseño físico
Implementación
CARRERA DE
INGENIERÍA DE SISTEMAS
Diseño de un Almacén de Datos
Recogida y análisis de requisitos
DATAWAREHOUSE
Análisis
Diseño conceptual
Diseño lógico
Diseño físico
Discernimiento de las fuentes necesarias del sistema de información de la organización (OLTP) y externas
Requisitos deusuario (consultas de análisis necesarias, nivel de agregación, …)
Implementación
Diseño Conceptual
p.ej. Entidad-Relación
CARRERA DE
INGENIERÍA DE SISTEMAS
Diseño de un Almacén de Datos
Recogida y análisis de requisitos
DATAWAREHOUSE
Diseño Lógico
Diseño conceptual
Diseño lógico
Modelado multidimensional (MR)
Diseño físico
Esquemas estrella
ImplementaciónCARRERA DE
INGENIERÍA DE SISTEMAS
Diseño de un Almacén de Datos
Recogida y análisis de requisitos
DATAWAREHOUSE
Diseño Físico
Diseño conceptual
Diseño lógico
Definición del esquema ROLAP o MOLAP
Diseño físico
Implementación
CARRERA DE
Diseño del ETL
INGENIERÍA DE SISTEMAS
Diseño de un Almacén de Datos
Recogida y análisis de requisitos
DATAWAREHOUSEImplementación
Diseño conceptual
Diseño lógico
Carga del AD (ETL) Preparación de las vistas de usuario (herramienta OLAP)
Diseño físico
Implementación
CARRERA DE
INGENIERÍA DE SISTEMAS
Diseño de un Almacén de Datos
• Detallemos más ahora el Diseño Lógico...
Recogida y análisis de requisitos
DATAWAREHOUSE
Diseño conceptual
La visión multidimensional seguida por lasherramientas de explotación de almacenes de datos (OLAP) ha inspirado los modelos y metodologías de diseño de este tipo de sistemas.
Diseño lógico
Diseño físico
En la literatura se habla de “Bases de Datos Multidimensionales” y de “Diseño Multidimensional”
Implementación
CARRERA DE
INGENIERÍA DE SISTEMAS
Modelamiento multidimensional
●
DATAWAREHOUSE
En un esquemamultidimensional se representa una actividad que es objeto de análisis (hecho) y las dimensiones que caracterizan la actividad (dimensiones). La información relevante sobre el hecho (actividad) se representa por un conjunto de indicadores (medidas o atributos de hecho). La información descriptiva de cada dimensión se representa por un conjunto de atributos (atributos de dimensión).
●
●
CARRERA DEINGENIERÍA DE SISTEMAS
Modelamiento multidimensional
●
DATAWAREHOUSE
El modelado multidimensional se puede aplicar utilizando distintos modelos de datos (conceptuales o lógicos). La representación gráfica del esquema multidimensional dependerá del modelo de datos utilizado (relacional, ER, UML, OO, ...).
●
CARRERA DE
INGENIERÍA DE SISTEMAS
Diseño de un Almacén de DatosEl desarrollo de la tecnología de almacenes de datos se ha caracterizado por:
- un temprano desarrollo industrial provocado por las demandas de los usuarios.
DATAWAREHOUSE
- el uso de metodologías de diseño centradas principalmente en los niveles lógico e interno. (la atención
se ha centrado en mejorar la eficiencia en la ejecución de consultas)
Metodología de diseño basada en elmodelo relacional: Modelo multidimensional de Kimball
No es muy congruente usar modelos para diseño conceptual….
CARRERA DE
INGENIERÍA DE SISTEMAS
Pasos en el diseño del almacén de datos:
● ●
DATAWAREHOUSE
Paso 1. Elegir un “proceso” de la organización para modelar. Paso 2. Decidir el gránulo (nivel de detalle) de representación del proceso. Paso 3. Identificar las dimensiones que...
Regístrate para leer el documento completo.