Date werehouse pdf

Solo disponible en BuenasTareas
  • Páginas : 26 (6273 palabras )
  • Descarga(s) : 4
  • Publicado : 20 de noviembre de 2009
Leer documento completo
Vista previa del texto
Data Warehouse
Hoy en día, las bases de datos relacionales son operativas en un entorno muy concreto que responde a las necesidades para las que se crearon. Estas necesidades suelen involucrar entornos de gestión puros en los que las características principales de las operaciones suelen ser las de la simplicidad en las estructuras y tipos de los datos, utilización de transacciones cortas, etc.Para ver un ejemplo supóngase la base de datos operativa que puede estar usando un cajero de una sucursal bancaria en ventanilla. Es cierto que el volumen de datos global de la base de datos puede ser muy alto, pero las operaciones que se manejan en cada una de las transacciones son muy simples (la inserción de un ingreso o de un reintegro en la base de datos probablemente involucre nada más que lainserción en una determinada tabla de una tupla que refleje este hecho). Por tanto, en cada una de las operaciones (de forma general) se involucran muy pocos datos; pero es cierto que el volumen global es enorme (y dado que se van acumulando diariamente tiende a crecer muy rápidamente). Además, la disponibilidad de la base de datos debe ser total: sería inaceptable que un cliente de dichasucursal se viese obligado a esperar 15 minutos a que el sistema gestor realizara la transacción que reflejase un reintegro para poder hacerlo. Por otra parte, las necesidades de información hoy en día han variado. La disponibilidad de gran cantidad de información es de vital importancia para los negocios ya que las decisiones de futuro se suelen tomar sobre la base de dicha información. Supongamos elejemplo de la sucursal bancaria de antes. Es evidente que si el director de dicha sucursal quiere tomar una decisión sobre si potenciar o no determinado producto financiero y para ello necesita analizar la evolución del índice de morosidad del último año, no va a tener en cuenta para ello, si determinado cliente ha acudido o no esa mañana a reponer una cantidad en su cuenta. Las necesidades deldirector son mucho más globales: necesita conocer la evolución ascendente o descendente de dicho índice sin entrar en detalle. Está claro, por tanto, que los hechos que la base de datos operativa tiene no son lo que el director necesita. Sin embargo la "globalización" de los datos que busca el director se basa claramente en la información reflejada en dicha base de datos, pero organizada de otramanera (en este caso resumida). Este tipo de necesidades para reflejar tendencias, evoluciones, hechos históricos en el negocio y posibilidades futuras son algo que la alta directiva de las instituciones o empresas debe manejar y maneja de una forma habitual y es la causante de que hayan aparecido en el mercado herramientas del tipo de "ayudas a la toma de decisiones". Los procesos que obtienen lainformación con la estructura adecuada (resumidos, globalizados, etc.) son sistemas que, a priori, involucran un alto coste en consumo de recursos dado el gran volumen de datos sobre el que actúan y el tiempo de procesamiento que conlleva la obtención de las nuevas estructuras. Está claro, por lo dicho antes, que las denominadas "bases de datos operacionales" o "de producción" de la empresa no sepueden ver afectadas en sus tiempos de respuesta por dicho consumo en recursos. Esto, unido al hecho de que la estructura de las bases de datos de producción puede no ser la óptima para la obtención de la información deseada, obliga a la aparición de una nueva estructura en la información: el Data Warehouse, que consiste en una "réplica masiva de los datos" disponibles en las bases de datosoperacionales de tal forma que su estructura ya no responda a las necesidades del modelo relacional puro, puesto que sobre ella no se van a efectuar las operaciones que se hacen sobre las primeras. Así, ya no existe necesidad de mantener una estructura de la información que esté normalizada, con lo que supone en ahorro de fraccionamiento de la información y las costosas operaciones de recuperación (join...
tracking img