Data warehouse

Solo disponible en BuenasTareas
  • Páginas : 25 (6065 palabras )
  • Descarga(s) : 0
  • Publicado : 16 de octubre de 2010
Leer documento completo
Vista previa del texto
3.4. Data Warehouse Manager
-------------------------------------------------
 
 Figura 3.9:   Data Warehouse Manager.  |

El DW Manager presenta las siguientes características y funciones principales:
* Se constituye típicamente al combinar un SGBD con software y aplicaciones dedicadas.
* Almacena los datos de forma multidimensional, es decir, a través de tablas de hechos y tablasde dimensiones.
* Gestiona las diferentes estructuras de datos que se construyan o describan sobre el DW, como Cubos Multidimensionales, Business Models, etc.
* Gestiona y mantiene metadatos.
Además, el DW Manager se encarga de:
* Transformar e integrar los datos fuentes y del almacenamiento intermedio en un modelo adecuado para la toma de decisiones.
* Realizar todas lasfunciones de definición y manipulación del depósito de datos, para poder soportar todos los procesos de gestión del mismo.
* Ejecutar y definir las políticas de particionamiento. El objetivo de realizar esto, es conseguir una mayor eficiencia y performance en las consultas al no tener que manejar todo el grueso de los datos. Esta política debe aplicarse sobre la tabla de hechos que, como se explicarámás adelante, es en la que se almacena toda la información que será analizada.
* Realizar copias de resguardo incrementales o totales de los datos del DW.
 
 
3.4.1. Base de datos multidimensional
Una base de datos multidimensional es una base de datos en donde su información se almacena en forma multidimensional, es decir, a través de tablas de hechos y tablas de dimensiones.
Proveen unaestructura que permite, a través de la creación y consulta a una estructura de datos determinada (cubo multidimensional, Business Model, etc), tener acceso flexible a los datos, para explorar y analizar sus relaciones, y consiguientes resultados.
Las bases de datos multidimensionales implican tres variantes posibles de modelamiento, que permiten realizar consultas de soporte de decisión:
*Esquema en Estrella (Star Scheme).
* Esquema Copo de Nieve (Snowflake Scheme).
* Esquema Constelación o copo de estrellas (Starflake Scheme).
Los mencionados esquemas pueden ser implementados de diversas maneras, que, independientemente al tipo de arquitectura, requieren que toda la estructura de datos este desnormalizada o semi desnormalizada, para evitar desarrollar uniones (Join)complejas para acceder a la información, con el fin de agilizar la ejecución de consultas. Los diferentes tipos de implementación son los siguientes:
*  Relacional — ROLAP.
*  Multidimensional — MOLAP.
* Híbrido — HOLAP.
3.4.2. Tablas de Dimensiones
Las tablas de dimensiones definen como están los datos organizados lógicamente y proveen el medio para analizar el contexto del negocio.Contienen datos cualitativos.
Representan los aspectos de interés, mediante los cuales l@s usuari@s podrán filtrar y manipular la información almacenada en la tabla de hechos.
En la siguiente figura se pueden apreciar algunos ejemplos:

 Figura 3.10:   Tablas de Dimensiones. |

Como se puede observar, cada tabla posee un identificador único y al menos un campo o dato de referencia que describelos criterios de análisis relevantes para la organización, estos son por lo general de tipo texto.
Los datos dentro de estas tablas, que proveen información del negocio o que describen alguna de sus características, son llamados datos de referencia.
Más detalladamente, cada tabla de dimensión podrá contener los siguientes campos:
* Clave principal o identificador único.
* Clave foráneas.* Datos de referencia primarios: datos que identifican la dimensión. Por ejemplo: nombre del cliente.
* Datos de referencia secundarios: datos que complementan la descripción de la dimensión. Por ejemplo: e-mail del cliente, fax del cliente, etc.
Usualmente la cantidad de tablas de dimensiones, aplicadas a un tema de interés en particular, varían entre tres y quince.
Debe tenerse en...
tracking img