Almacenes de datos

Solo disponible en BuenasTareas
  • Páginas : 20 (4962 palabras )
  • Descarga(s) : 0
  • Publicado : 9 de mayo de 2011
Leer documento completo
Vista previa del texto
Almacén de datos
De Wikipedia, la enciclopedia libre
Saltar a navegación, búsqueda


Descripción de un Data Warehouse.
En el contexto de la informática, un almacén de datos (del inglés data warehouse) es una colección de datos orientada a un determinado ámbito (empresa, organización, etc.), integrado, no volátil y variable en el tiempo, que ayuda a la toma de decisiones en la entidad enla que se utiliza. Se trata, sobre todo, de un expediente completo de una organización, más allá de la información transaccional y operacional, almacenado en una base de datos diseñada para favorecer el análisis y la divulgación eficiente de datos (especialmente OLAP, procesamiento analítico en línea). El almacenamiento de los datos no debe usarse con datos de uso actual. Los almacenes de datoscontienen a menudo grandes cantidades de información que se subdividen a veces en unidades lógicas más pequeñas dependiendo del subsistema de la entidad del que procedan o para el que sean necesario.
Contenido
[ocultar]
• 1 Definiciones de almacén de datos
o 1.1 Definición de Bill Inmon
o 1.2 Definición de Ralph Kimball
o 1.3 Una definición más amplia de almacén de datos
• 2 Función de unalmacén de datos
• 3 Data marts
• 4 Cubos de información
o 4.1 Dimensiones
o 4.2 Variables
o 4.3 Ejemplos
• 5 Elementos que integran un almacén de datos
o 5.1 Metadatos
o 5.2 Funciones ETL (extracción, transformación y carga)
o 5.3 Middleware
• 6 Diseño de un almacén de datos
• 7 Almacén de datos espacial
• 8 Ventajas e inconvenientes de los almacenes de datos
o 8.1 Ventajas
o8.2 Inconvenientes
• 9 Véase también
• 10 Referencias
• 11 Enlaces externos

[editar] Definiciones de almacén de datos
[editar] Definición de Bill Inmon
Bill Inmon fue uno de los primeros autores en escribir sobre el tema de los almacenes de datos, define un data warehouse (almacén de datos) en términos de las características del repositorio de datos:
• Orientado a temas.- Los datos en labase de datos están organizados de manera que todos los elementos de datos relativos al mismo evento u objeto del mundo real queden unidos entre sí.
• Variante en el tiempo.- Los cambios producidos en los datos a lo largo del tiempo quedan registrados para que los informes que se puedan generar reflejen esas variaciones.
• No volátil.- La información no se modifica ni se elimina, una vezalmacenado un dato, éste se convierte en información de sólo lectura, y se mantiene para futuras consultas.
• Integrado.- La base de datos contiene los datos de todos los sistemas operacionales de la organización, y dichos datos deben ser consistentes.
Inmon defiende una metodología descendente (top-down) a la hora de diseñar un almacén de datos, ya que de esta forma se considerarán mejor todos losdatos corporativos. En esta metodología los Data marts se crearán después de haber terminado el data warehouse completo de la organización.
[editar] Definición de Ralph Kimball
Éste es otro conocido autor en el tema de los data warehouse, define un almacén de datos como: "una copia de las transacciones de datos específicamente estructurada para la consulta y el análisis". También fue Kimballquien determinó que un data warehouse no era más que: "la unión de todos los Data marts de una entidad". Defiende por tanto una metodología ascendente (bottom-up) a la hora de diseñar un almacén de datos.
[editar] Una definición más amplia de almacén de datos
Las definiciones anteriores se centran en los datos en sí mismos. Sin embargo, los medios para obtener y analizar esos datos, paraextraerlos, transformarlos y cargarlos, así como las diferentes formas para realizar la gestión de datos son componentes esenciales de un almacén de datos. Muchas referencias a un almacén de datos utilizan esta definición más amplia. Por lo tanto, en esta definición se incluyen herramientas para la inteligencia empresarial, herramientas para extraer, transformar y cargar datos en el almacén de datos, y...
tracking img