Topicos

Solo disponible en BuenasTareas
  • Páginas : 5 (1054 palabras )
  • Descarga(s) : 0
  • Publicado : 25 de mayo de 2011
Leer documento completo
Vista previa del texto
Un almacén de datos (del ingles data Warehouse) es una colección de datos orientada a un determinado ámbito, integrado, no volátil y variable en el tiempo, que ayuda a la toma de decisiones en la entidad en la que se utiliza. Los almacenes de datos contienen a menudo grandes cantidades de información que se subdividen a veces en unidades lógicas más pequeñas dependiendo del subsistema de laentidad del que procedan o para el que sean necesario. Data Warehouse es un repositorio de datos de muy fácil acceso, alimentado de numerosas fuentes, transformadas en grupos de información sobre temas específicos de negocios, para permitir nuevas consultas, análisis, reporteador y decisiones.
Los objetivos fundamentales de un Data Warehouse son:
• Hace que la información de la organización seaaccesible:
• Hacer que la información de la organización sea consistente:
• Es información adaptable y elástica:
• Es un seguro baluarte que protege los valores de la información:
En el funcionamiento de un almacen de los datos son muy importantes las siguientes ideas:
• Integracion de los datos provenientes de bases de datos distribuidad por las diferentes unidades de la organización y que confrecuencia tendran diferentes estructuras.
• Separacion de los datos usados en operaciones diarias de los datos usados en el almacen de datos para los propositos de divulgación, de ayuda en la toma de decisiones, para el analisis y para operaciones de control.

El diseño de un DW debe estar orientado a optimizar las consultas relacionadas con los aspectos del negocio que se desean estudiar.Entre los aspectos a tener en cuenta al afrontar el diseño de un DW hay que tener especial cuidado al:
• Identificar las tablas de hecho, ya que es posible tener mas de una.
• Identificar las tablas de dimensión
• Comprobar que ninguna de las tablas de hechos oculta tablas de dimensiones.
• Comprobar que ninguna de las tablas de dimensión oculta una tabla de hechos.

ETL son las siglas eningles de Extraer, Transformar y Cargar. Es el proceso que permite a las organizaciones mover datos desde multiples fuentes, reformatearlos y limpiarlos y cargos en otra base de datos, data mart o data Warehouse para analizar, o en otro sistema operacional.
Extraer consiste en extraer los datos desde los sistemas de origen.
Una parte intrinseca del proceso de extracción es la de analizar los datosextraidos, de lo que resulta un chequeo que verifica si lso datos cumplen la pauta o estructura que se esperaba. De no ser asi los datos son rechazados.
Un requerimiento importante que se debe exigir a la tarea de extracción es que esta cause un impacto minimo en el sistema origen.

Tranformar la fase de transformación aplica una serie de reglas de negocio o funciones sobre los datos extraidospara convertirlos en datos que seran cargados.

Las sig transformaciones:
• Seleccionar solo ciertas columnas para su carga
• Traducir codigos
• Codificar valores libres
• Obtener nuevos valores calculados
• Unir datos de multiples fuentes
• Calcular totales de multiples filas de datos
• Generacion de campos claves en el destino
• Transponer o pivotear
• Dividir una columna en varias
•La aplicación de cualquier forma, simple o compleja de validación de datos
• Datos OK
• Datos erroneos
Carga: Es el momento en el cual los datos de la fase anterior son cargados en el sistema destino, este proceso puede abarcar una amplia variedad de acciones diferentes
Dos formas basicas de desarrollar el proceso carga:
Acumulacion simple: consiste en realizar un resumen de todas lastransacciones comprendidas en el periodo de tiempo seleccionado y transportar el resultado como una unica transacción hacia el data Warehouse
Rolling: Se aplica en los casos en que se opta por mantener varios niveles de granularidad.

OLAP.- Procesamiento analitico en linea, es una solucion utilizada en el campo de la llamada inteligencia empresarial cuyo objetivo es agilizar la consulta de grandes...
tracking img