Almacenes de datos

Solo disponible en BuenasTareas
  • Páginas : 10 (2259 palabras )
  • Descarga(s) : 0
  • Publicado : 15 de diciembre de 2011
Leer documento completo
Vista previa del texto
Data Warehouse (Almacenes de Datos)
Bases de Datos 1 Casales Cabrera María Evelia
Maestría en Ciencias e Ingeniería de la Computación, 2009-1

Data Warehouse (Almacén de Datos)

Un Almacén de Datos (o Data Warehouse) es una gran colección de datos que recoge información de múltiples sistemas fuentes u operacionales dispersos, y cuya actividad se centra en la “Toma de Decisiones”. Una vezreunidos los datos de los sistemas fuentes se guardan durante mucho tiempo, lo que permite el acceso a datos históricos; así los Almacenes de Datos proporcionan al usuario una interfaz consolidada única para los datos, lo que hace más fácil escribir las consultas para la Toma de Decisiones.

Page

2

Diferencias entre Base de Datos y Almacén de Datos
Base de Datos Operacional DatosOperacionales Orientado a aplicación Actual Detallada Cambia continuamente Almacén de Datos Datos del negocio para Información Orientado al sujeto Actual + Histórico Detallada + Resumida Estable

Page

3

Características del Almacén de Datos
Organizado en torno a temas. La información se clasifica en base a los aspectos que son de interés para la empresa. Integrado. Es el aspecto más importante.La integración de datos consiste en convenciones de nombres, codificaciones consistentes, medida uniforme de variables, etc. Dependiente del tiempo. Esta dependencia aparece de tres formas:
– La información representa los datos sobre un horizonte largo de tiempo. – Cada estructura clave contiene (implícita o explícitamente) un elemento de tiempo (día, semana, mes, etc.). – La información, una vezregistrada correctamente, no puede ser actualizada.

No volátil. El Almacén de Datos sólo permite cargar nuevos datos y acceder a los ya almacenados, pero no permite ni borrar ni modificar los datos.

Page

4

Data Warehousing
Data Warehousing es el proceso que facilita la creación y explotación de un Almacén de Datos. Los Sistemas de Data Warehousing incluyen funcionalidades como:Integración de bases de datos heterogéneas (relacionales, documentales, geográficas, archivos, etc.) Ejecución de consultas complejas no predefinidas visualizando el resultado en forma gráfica y en diferentes niveles de agrupamiento y totalización de datos. Agrupamiento y desagrupamiento de datos en forma interactiva. Análisis del problema en términos de dimensiones. Control de calidad de datos.Page

5

Etapas de Diseño del Almacén de Datos
Origen (Source): Define los orígenes de datos del Almacén de Datos, como los sistemas de Procesamiento de Transacciones en Línea (OnLine Transaction Processing, OLTP), las fuentes de datos externas (datos sindicados, datos censales), etc. Integración (Integration): Define el mapeo entre los orígenes de datos y el propio Almacén de Datos. Almacénde Datos (Data Warehouse): Define la estructura del Almacén de Datos. Adaptación (Customization): Define el mapeo entre el Almacén de Datos y las estructuras empleadas por el cliente. Cliente (Client): Define las estructuras concretas que son empleadas por los clientes para acceder al Almacén de Datos, como Data Marts o aplicaciones OLAP. Page 6

Niveles por Etapa del Diseño del Almacén de DatosCada etapa se analiza desde tres niveles o perspectivas que se crean en el siguiente orden: Conceptual: Define el Almacén de Datos desde un punto de vista conceptual, es decir, desde el mayor nivel de abstracción y contiene únicamente los objetos y relaciones más importantes. Lógico: Abarca aspectos lógicos del diseño del Almacén de Datos, como la definición de las tablas y claves, la definiciónde los procesos ETL, etc. Físico: Define los aspectos físicos del Almacén de Datos, como el almacenamiento de las estructuras lógicas en diferentes discos o la configuración de los servidores de bases de datos que mantienen el almacén de datos.

Page

7

Diagramas de Formalización
Cada etapa o nivel necesita formalismos de modelado diferentes. Una aproximación es la siguiente, donde el...
tracking img