Data warehouse

Solo disponible en BuenasTareas
  • Páginas : 17 (4064 palabras )
  • Descarga(s) : 0
  • Publicado : 3 de junio de 2011
Leer documento completo
Vista previa del texto
Capítulo 3. Data Warehouse

Un Data Warehouse (DW) es la colección de datos, organizados, integrados, historiados y disponibles para facilitar la toma de decisiones de usuarios finales [9]. Desde el punto de vista de su construcción, un DW es una colección de bases de datos integradas no volátiles y orientadas a ciertos temas, diseñada para apoyar la toma de decisiones, donde cada unidad dedatos es relevante en un momento de tiempo [15a].

Este capítulo presenta la tecnología DW. La sección 3.1 define los conceptos de base para la comprensión de este trabajo. La sección 3.2 describe la fase de diseño de un DW, se presenta el modelo multidimensional. Las secciones 3.3, 3.4 y 3.5 describen respectivamente las fases de construcción, mantenimiento y de análisis de un DW. Finalmente lasección 3.6 discute el interés de un DW para el análisis de la información y las dificultades de implementación asociadas a su construcción, explotación y mantenimiento.

3.1 Arquitectura
La arquitectura de diseño de un DW como se muestra en la Figura 3.1 puede ser visto como un proceso de cuatro pasos, los cuales se listan a continuación:

DW

Integrador

Extractor/ MonitorExtractor/Monitor

Extractor/ Monitor

Fuente

Fuente

Fuente

Figura 3.1 Arquitectura de un DW [5]



Diseño. Se refiere al proceso de elegir y diseñar la estructura interna, misma que soportará la manipulación y recuperación de los datos, es decir, diseñar la estructura interna del DW y como va almacenar los datos a la par de cómo los hará disponibles.



Construcción. Se refiere aldiseño e implementación de las herramientas encargadas de llevar los datos de las fuentes al repositorio, y ya una vez dentro de este los homogenizará. En base a la construcción existen tres aspectos a considerar:

o Conectar las fuentes mediante extractores, se refiere a la implementación de los extractores, mismo que deben conocer le formato, protocolo y ubicación tanto de las fuentes como delDW. o Integrar las fuentes, se refiere a reunir la información presentada en las diversas fuentes en un mismo sitio con un mismo formato.

o Poblar el repositorio con los esquemas y vistas definidos, una vez que la fase de diseño fue cumplida en base al análisis realizado, procede poblar el DW con las información de las fuentes en los esquemas definidos.



Análisis. Es la explotación que serealiza de los datos almacenados dentro del DW a través de técnicas que facilitan y hacen más eficiente la consulta de los mismos. Ya con el DW poblado lo último es diseñar e implementar una interfaz que le permita al usuario final interactuar con el sistema, brindándole todas la ventajas del análisis de la información.



Mantenimiento. Proceso encargado de llevar los datos nuevos que seingresen en el repositorio y también se encarga de actualizar los datos previamente calculados en las vistas.

3.2 Modelo multidimensional
Para el diseño de un DW, en general, se emplea la representación de un modelo multidimensional. El modelado multidimensional es una técnica de diseño lógico que busca presentar los datos en un estándar, que permita una recuperación adecuada de estos.

Elmodelo multidimensional es un modelo adecuado que provee un camino viable para agregar hechos a lo largo de múltiples atributos, llamados dimensiones. Los datos son almacenados como hechos y dimensiones en un modelo de datos relacional [9a]. Para

poder entender la definición presentada así como el modelo multidimensional se deben comprender tres conceptos: cubo, medida, dimensión.

3.2.1 CuboUn modelo de datos multidimensional soporta el manejo de una basta cantidad de datos empresariales y temporales. De esta forma surge la instancia del modelo multidimensional, también conocido como cubo o hipercubo, en cual podemos encontrar en interacción los conceptos mencionados en estos párrafos.

Para clarificarlo un poco se puede imaginar un cubo con tres dimensiones: producto, tiempo,...
tracking img