Datawarehouse
Marta Millan
millan@eisc.univalle.edu.co
www.eisc.univalle.edu.co/materias
Hechos
Los hechos son transacciones que han ocurrido en
algún punto en el pasado, y que es muy poco
probable que cambien en el futuro
Los hechos se pueden analizar de diferentes
formas dependiendo de la información de
referencia
Los hechos suelen tener pocos atributos, puesto
que no tiene datos operacionalesDimensiones
Sirven para representar cada uno de los factores por los
que se puede analizar un determinado área de negocio
Son tablas siempre más pequeñas
A menudo se desnormalizan
clave_día
día
clave_mes
mes
mes
clave_mes
clave_día
día
clave_mes
mes
Hechos y dimensiones
Sucursales
Clientes
Ventas
Productos
July 2001
M
T
W
T
F
S
S
2
3
4
5
6
7
8
9
10
11
12
13
14
15
1617
18
19
20
21
22
23
24
25
26
27
28
29
30
31
1
Pc
Portátil
Ratón
Teléfono
Fax
Fecha
Diagramas en estrella
Cliente
Producto
Ventas
Fecha
Tabla de
hechos
Sucursal
Tablas de dimensión
TV
PC
VCR
suma
1Qtr
Fecha
2Qtr 3Qtr
4Qtr
Ventas totales de
television en T1.
suma
T1
T2
T3
suma
Tienda
Pr
od
uc
t
o
Datos multidimensionales
Diseño STAR: pasos a seguir
Dediagrama E/R surgen múltiples diagramas
en estrella
Separar en procesos discretos de negocio
(hechos) y modelar cada hecho
Seleccionar relaciones n:m con atributos
numéricos
Desnormalizar las tablas de dimensión
Diseño STAR: pasos a seguir
Diagrama E/R
T
E
A
R
C
S
D
Diagrama en
estrella
A
B
B
R
C
Fecha
Diseño de la tabla de hechos
Decidir la granularidad de la tabla de hechos
Establecelo que significa cada registro de la
tabla de hechos
Decidir las dimensiones
Decidir los hechos de la tabla de hechos
Deben ser específicos para la granularidad
seleccionada para la tabla de hechos
Diseño de la tabla de hechos
Identificar el periodo histórico significativo para los
distintos procesos y el grado de detalle requerido
Eliminar todas las columnas del hecho que no sean
requeridas pararesponder a preguntas de toma de
decisiones
Ajustar el tamaño de cada columna
Usar claves generadas
Claves primarias y extranjeras
Todas las claves que se utilicen en tablas del Data
Warehouse deben ser claves sin significado
Nunca se deben usar claves de producción
Facilitar los cambios
Situaciones “no lo se”, “desconocido”
Dimensiones que cambian en el tiempo
Aditividad
Siempre que seaposible, los hechos de la tabla de
hechos deberían elegirse para que sean
perfectamente aditivos (se pueden sumar por
cualquier dimensión)
Las medidas de actividad son generalmente
aditivas
Las medidas de intensidad no siempre lo son
(niveles de inventario, balance de cuentas...)
Análisis de aditividad
Fecha
Ventas
Cod_Fecha
Cod_Sucursal
producto
Cod_Producto
Sucursal
Cod_Cliente
UnidadesAlmacenes
Fecha
Cantidad
aditiva
Cod_Fecha
Cod_Almacén
Cod_Producto
Almacén
Cliente
Stock
producto
Cantidad
NO aditiva
Diseño de las dimensiones
Son tablas más pequeñas
Desnormalizar si se acceden muy a menudo en las
consultas para acelerar el desempeño (Esquemas
estrella)
Establecer la política para dimensiones cambiantes
Actualizar los cambios
Atributos valor antiguo – valor nuevo
Generarun nuevo código para el nuevo valor
Normalización de dimensiones
Se dice que una dimensión está “snowflaked”
cuando los atributos de baja cardinalidad se llevan
a tablas separadas
Generalmente no se recomienda
A veces se usa para ahorrar espacio de
almacenamiento
No permite hacer uso de los índices de bitmap
Sin embargo existen situaciones (datos
demográficos) en las que son aconsejablesDiseñar las tablas dimensión
Categorias comerciales
Clave_categoria_comercial
Categoria_comercial
Marketing
Clave_marca_comercial
Marca_comercial
Clave_categoria_comercial
Finanzas
Categorias financieras
Clave_categoria_financiera
Categoria_financiera
Clave_marca_financiera
Marca_financiera
Clave_categoria_financiera
Embalajes
Clave_tipo_embalaje
Tipo_embalaje
Sabores
Clave_sabor
Sabor
Producto...
Regístrate para leer el documento completo.