CAPITULO 5 DEL LIBOR DATAWAREHOUSE
Hora de clase: Lunes- Jueves 11:00-13:00 Miércoles 11:00-12:00
Capítulo 5
Modelado de Datos
En este capítulo, vamos a diseñar los almacenes de datos para el estudio de caso Amadeus Entertainment. Vamos a utilizarla arquitecturaNDS+DDS. Además de los beneficios descritos en el Capítulo2, el propósito de la elección de esta arquitectura para este estudio de caso es porlo que usted puede tener la experiencia de diseñar una tienda normalizada y una tienda dimensional.
Vamos aempezar por examinarlosrequisitos del negocioy luego diseñarel almacén de datosdimensional(DDS) en consecuencia.Vamos a definirel significadode los atributos de hechos y dimensionales. También vamos adefinir lajerarquía de datos.
A continuación vamos acorrelacionar losdatosenelDDSconlossistemas de origen; es decir, vamos a definirel origen delascolumnas de las tablasde hechos y dimensiones. A vecesuna columnaen elDDSestá pobladade varias tablasenel sistema de origen(por ejemplo, de la columna1 de la tabla Ay la columna1 de la tablaB) y, a vecesde más de unsistema de origen. Vamos a definir las transformaciones (fórmula, cálculos lógicos o lookups) necesarios para rellenar lascolumnas de destino.
Despuésvamos a diseñarel almacén de datosnormalizado(NDS) normalizando elalmacén de datosdimensional ymediante el examen delosdatos de lossistemas de origenque hemosmapeado. Lasreglas de normalizaciónyla primera, segundayterceraformas normalesse describenen el apéndice.Vamos a utilizarestas reglaspara diseñar elNDS.
Diseñando el almacén de datos dimensional
Por lo tanto,vamos aempezar porel diseño delDDS. Losusuarios podránutilizar elalmacén de datos parahacer un análisisen seisáreas de negocio:la venta de productos, las ventas de suscripciones, la rentabilidad de suscriptores, desempeño de los proveedores, la segmentaciónde campañaCRM, y los resultadosde la campañade CRM. Por lo tanto,es necesario analizarcada área de negociode uno en unopara modelarlos procesos denegociocon el fin decrear elmodelo de datos. Vamos a hacerla primeraárea de negocio: la venta de productos. Unartículo para ordenar del data mart en elsector del comercio minoristaesun ejemplo clásico dealmacenamiento de datos.
Unevento de ventasde productossucede cuando uncliente está comprandoun producto, en vez desuscribirsea un paquete. Losroles (elquién, dónde,y qué) en esteeventosonelcliente, el producto y tienda.Losniveles(o en términos de modeladodimensional, lasmedidas) son la cantidad, el preciounitario, el valor, el costo unitario directo, yel costo unitarioindirecto. Recibimosestos nivelesdelosrequerimientos del negocioenel capítulo 4; en otraspalabras, sonlo que los usuariosnecesitanpara realizar sus tareas. Ponemoslasmedidasenla tabla de hechosy las funciones(másfechas)enlastablas de dimensiones. Loseventos de negociosse convierten enla filatabla de hechos.Figura5-1describe el resultado.
Figura 5: Tabla de hechos de Ventas de Productos y sus dimensiones
Las medidas quantity, unit_price y unit_costse derivan delsistema de origen, perose calculanlasotrastresmedidas (sales_value, sales_costymargin). Estosse definen como sigue:
Lascuatrollaves en latabla dehechosventas por productovinculanla tabla de hechosconlas cuatro dimensiones. SegúnRalphKimball, es importante declararel grano de latabla de hechos. El grano esla unidad más pequeñade laocurrencia delevento de negociosen el quese mideel evento.En otras palabras, el grano está completandoesta frase: "Una fila de latabla de hechoscorresponde al. ..."Eneste caso, el granoescada artículo vendido-una fila enla tabla de hechosde ventas de productocorresponde acada artículo vendido.
Esfácil de definirmedidassencillas paranuestro caso de estudio, tales como valor de las ventas, costode ventasy el margen, pero en la prácticacuando se realizael modelado de datostenemos quehacer frente a casoscomplejos,funciones, excepciones, y la lógicaque sonespecíficas de la industria, tales como descuentos,...
Regístrate para leer el documento completo.