Fundamentos Data warehouse
Mendez, A., Mártire, A., Britos, P. Y Garcia-Martínez, R.
Centro de Actualización Permanente en Ingeniería del Software
Escuela de Postgrado
Instituto Tecnológico de Buenos Aires
Av. Eduardo Madero 399 – (C1106ACD) – Buenos Aires - ARGENTINA
mendez_andrea@yahoo.com.ar, ariel_martire@yahoo.com
1. Introducción
El Data Warehouse es una tecnología para elmanejo
de la información construido sobre la base de
optimizar el uso y análisis de la misma utilizado por
las organizaciones para adaptarse a los vertiginosos
cambios en los mercados. Su función esencial es ser
la base de un sistema de información gerencial, es
decir, debe cumplir el rol de integrador de
información proveniente de fuentes funcionalmente
distintas (Bases Corporativas, Basespropias, de
Sistemas Externos, etc.) y brindar una visión
integrada de dicha información, especialmente
enfocada hacia la toma de decisiones por parte del
personal jerárquico de la organización.
Es un sitio donde se almacena de manera integrada
toda la información resultante de la operatoria diaria
de la organización. Además, se almacenan datos
estratégicos y tácticos con el objetivo deobtener
información estratégica y táctica que pueden ser de
gran ayuda para aplicar sobre los mismos técnicas de
análisis de datos encaminadas a obtener información
oculta (Data Mining).
Esta información incluye movimientos que
modifican el estado del negocio, cualquier
interacción que se tenga con los clientes y
proveedores, y cualquier dato adicional que ayude a
comprender la evolución delnegocio.
Esta tecnología ayuda a la organización a responder
preguntas esenciales para la toma de decisiones que
le permitan obtener ventajas competitivas y mejorar
su posición en el mercado en el que operan. Algunas
de las preguntas podrían ser:
-
Cuál es el perfil de mis clientes?
Cómo es su comportamiento?
Cuál es la rentabilidad que me deja?
Cuál es el riesgo que corro con él?
Quéservicios y productos utiliza y cómo
puedo incrementarlos?
Etc.
Además, se aplican técnicas de limpieza e
integración de datos, esto asegura la existencia de
estructuras homogéneas persistentes en el tiempo.
Para comprender mejor el funcionamiento de ésta
tecnología explicaremos su arquitectura y los
sistemas OLTP y OLAP.
2. Arquitectura del Data Warehouse
La arquitectura (Figura 2)de esta tecnología está
integrada por los siguientes componentes:
2.1. OLTP (On-Line Transaction Processing)
Son aplicaciones que definen el comportamiento
habitual de un entorno operacional de gestión y
ejecutan las operaciones del día a día. Algunas de las
características más comunes de este tipo de
transacciones podrían ser:
-Altas/Bajas/Modificaciones
- Consultas rápidas, escuetas ypredecibles
- Poco volumen de información e
información disgregada
- Transacciones rápidas
- Gran nivel de concurrencia
- Modo de actualización on-line
- Baja redundancia de datos
Algunos ejemplos de este tipo de aplicaciones son:
- Compras
- Ventas
- Inventario
- Sueldos
2.2. Consolidación
Es la parte del proceso de Data Warehouse que se
encarga de producir el cambio de los sistemasOLTP
a las Bases de Datos OLAP. Consolidan datos de
aplicaciones no integradas, sumarizan datos
Reportes Técnicos en Ingeniería del Software. Vol. 5(1). Pág.. 19-26. 2003
ISSN: 1667-5002. © CAPIS-EPG-ITBA (http:// http://www.itba.edu.ar/capis/rtis)
Fundamentos de Data Warehouse
disgregados y los transforman. Este proceso está
compuesto por tres pasos
-
Validación deConsistencia de los datos
-
-
Comprueba la validez de los datos en el
entorno operacional
Inconsistencia entre distintas aplicaciones
dentro del sistema
Mecanismos de Consolidación
- Refresco de datos: Volcado completo de los
datos procedentes del sistema operacional
entre el Cliente y el Servidor. Actúa como traductor
entre distintas tecnologías. Permite que dos o más
sistemas trabajen...
Regístrate para leer el documento completo.