Tarea Bi Y Etl
BI
Contents
1. ¿QUÉ ES UNA HERRAMIENTA ETL? 3
2. ¿QUIÉN ES EL PADRE DEL DWH Y MODELO PROPUESTO? 3
3. ¿QUÉ ES UN OPERATIONAL DATA STORE (ODS)? 3
4. ¿QUÉ ES UN DWH? 3
5. ¿QUÉ SON LOS METADATOS? 3
6. ¿QUÉ ES UN DATAMART? 3
7. REFERENCIAS 3
1. ¿QUÉ ES UNA HERRAMIENTA ETL?
(Extract – Transform - Load) Es el proceso que permite a las organizaciones moverdatos desde múltiples fuentes, reformatearlos y limpiarlos, y cargarlos en otra base de datos, data mart o data warehouse para analizarlos, o en otro sistema operacional para apoyar un proceso de negocio.
Extraer
La primera parte del proceso ETL consiste en extraer los datos desde los sistemas de origen. La mayoría de los proyectos de almacenamiento de datos fusionan datos provenientes dediferentes sistemas de origen. Cada sistema separado puede usar una organización diferente de los datos o formatos distintos. Los formatos de las fuentes normalmente se encuentran en bases de datos relacionales o ficheros planos, pero pueden incluir bases de datos no relacionales u otras estructuras diferentes. La extracción convierte los datos a un formato preparado para iniciar el proceso detransformación.
Transformar
La fase de transformación aplica una serie de reglas de negocio o funciones sobre los datos extraídos para convertirlos en datos que serán cargados. Algunas fuentes de datos requerirán alguna pequeña manipulación de los datos. No obstante en otros casos pueden ser necesarias aplicar algunas de las siguientes transformaciones:
* Seleccionar sólo ciertas columnas para sucarga (por ejemplo, que las columnas con valores nulos no se carguen).
* Traducir códigos (por ejemplo, si la fuente almacena una "H" para Hombre y "M" para Mujer pero el destino tiene que guardar "1" para Hombre y "2" para Mujer).
* Codificar valores libres (por ejemplo, convertir "Hombre" en "H" o "Sr" en "1").
* Obtener nuevos valores calculados (por ejemplo, total_venta = cantidad* precio).
* Unir datos de múltiples fuentes (por ejemplo, búsquedas, combinaciones, etc.).
* Calcular totales de múltiples filas de datos (por ejemplo, ventas totales de cada región).
* Generación de campos clave en el destino.
* Transponer o pivotar (girando múltiples columnas en filas o viceversa).
* Dividir una columna en varias (por ejemplo, columna "Nombre: García,Miguel"; pasar a dos columnas "Nombre: Miguel" y "Apellido: García").
* La aplicación de cualquier forma, simple o compleja, de validación de datos, y la consiguiente aplicación de la acción que en cada caso se requiera:
* Datos OK: Entregar datos a la siguiente etapa (Carga).
* Datos erróneos: Ejecutar políticas de tratamiento de excepciones (por ejemplo, rechazar el registrocompleto, dar al campo erróneo un valor nulo, etc).
Carga
La fase de carga es el momento en el cual los datos de la fase anterior (transformación) son cargados en el sistema de destino. Dependiendo de los requerimientos de la organización, este proceso puede abarcar una amplia variedad de acciones diferentes. En algunas bases de datos se sobrescribe la información antigua con nuevos datos. Los datawarehouse mantienen un historial de los registros de manera que se pueda hacer una auditoría de los mismos y disponer de un rastro de toda la historia de un valor a lo largo del tiempo.
2. ¿QUIÉN ES EL PADRE DEL DWH Y MODELO PROPUESTO?
Bill Inmon es considerado como el padre del Data Warehouse.
Inmon defiende una metodología descendente (top-down) a la hora de diseñar un DataWarehouse, ya que de esta forma se considerarán mejor todos los datos corporativos. En esta metodología, los Data Marts se crearán después de haber terminado el Data Warehouse completo de la organización.
El Modelo Propuesto contiene las siguientes características:
* Orientado a Temas: Los datos en la base de datos están organizados de manera que todos los elementos de datos relativos al mismo...
Regístrate para leer el documento completo.