Fundamentos de datawarehouse

Solo disponible en BuenasTareas
  • Páginas : 15 (3702 palabras )
  • Descarga(s) : 0
  • Publicado : 8 de agosto de 2010
Leer documento completo
Vista previa del texto
Fundamentos de Data Warehouse
Mendez, A., Mártire, A., Britos, P. Y Garcia-Martínez, R.
Centro de Actualización Permanente en Ingeniería del Software Escuela de Postgrado Instituto Tecnológico de Buenos Aires Av. Eduardo Madero 399 – (C1106ACD) – Buenos Aires - ARGENTINA mendez_andrea@yahoo.com.ar, ariel_martire@yahoo.com

1. Introducción
El Data Warehouse es una tecnología para el manejo dela información construido sobre la base de optimizar el uso y análisis de la misma utilizado por las organizaciones para adaptarse a los vertiginosos cambios en los mercados. Su función esencial es ser la base de un sistema de información gerencial, es decir, debe cumplir el rol de integrador de información proveniente de fuentes funcionalmente distintas (Bases Corporativas, Bases propias, deSistemas Externos, etc.) y brindar una visión integrada de dicha información, especialmente enfocada hacia la toma de decisiones por parte del personal jerárquico de la organización. Es un sitio donde se almacena de manera integrada toda la información resultante de la operatoria diaria de la organización. Además, se almacenan datos estratégicos y tácticos con el objetivo de obtener informaciónestratégica y táctica que pueden ser de gran ayuda para aplicar sobre los mismos técnicas de análisis de datos encaminadas a obtener información oculta (Data Mining). Esta información incluye movimientos que modifican el estado del negocio, cualquier interacción que se tenga con los clientes y proveedores, y cualquier dato adicional que ayude a comprender la evolución del negocio. Esta tecnología ayudaa la organización a responder preguntas esenciales para la toma de decisiones que le permitan obtener ventajas competitivas y mejorar su posición en el mercado en el que operan. Algunas de las preguntas podrían ser: Cuál es el perfil de mis clientes? Cómo es su comportamiento? Cuál es la rentabilidad que me deja? Cuál es el riesgo que corro con él? Qué servicios y productos utiliza y cómo puedoincrementarlos? Etc.

Además, se aplican técnicas de limpieza e integración de datos, esto asegura la existencia de estructuras homogéneas persistentes en el tiempo. Para comprender mejor el funcionamiento de ésta tecnología explicaremos su arquitectura y los sistemas OLTP y OLAP.

2. Arquitectura del Data Warehouse
La arquitectura (Figura 2) de esta tecnología está integrada por lossiguientes componentes: 2.1. OLTP (On-Line Transaction Processing) Son aplicaciones que definen el comportamiento habitual de un entorno operacional de gestión y ejecutan las operaciones del día a día. Algunas de las características más comunes de este tipo de transacciones podrían ser: -Altas/Bajas/Modificaciones - Consultas rápidas, escuetas y predecibles - Poco volumen de información e informacióndisgregada - Transacciones rápidas - Gran nivel de concurrencia - Modo de actualización on-line - Baja redundancia de datos Algunos ejemplos de este tipo de aplicaciones son: - Compras - Ventas - Inventario - Sueldos 2.2. Consolidación Es la parte del proceso de Data Warehouse que se encarga de producir el cambio de los sistemas OLTP a las Bases de Datos OLAP. Consolidan datos de aplicaciones nointegradas, sumarizan datos

Reportes Técnicos en Ingeniería del Software. Vol. 5(1). Pág.. 19-26. 2003 ISSN: 1667-5002. © CAPIS-EPG-ITBA (http:// http://www.itba.edu.ar/capis/rtis)

Fundamentos de Data Warehouse

disgregados y los transforman. Este proceso está compuesto por tres pasos Validación de Consistencia de los datos Comprueba la validez de los datos en el entorno operacionalInconsistencia entre distintas aplicaciones dentro del sistema

-

Actualización de datos: Volcado incremental tomando como criterio la fecha de operación Propagación de datos

Factores técnicos - Mecanismo de transporte - Tiempos de carga - Reformateo de datos 2.3. Middleware Es un software que reside físicamente en un Cliente y en un Servidor de Comunicaciones, localizado 2.4. OLAP (On-Line...
tracking img