Base d e datos
ETL - este termino viene de ingles de las siglas Extract-Transform-Load que significan Extraer, Transformar y Cargar y se refiere a los datos en unaempresa. ETL es el proceso que organiza el flujo de los datos entre diferentes sistemas en una organización y aporta los métodos y herramientas necesarias para mover datos desde múltiples fuentes a unalmacén de datos, reformatearlos, limpiarlos y cargarlos en otra base de datos, data mart ó bodega de datos. ETL forma parte de la Inteligencia Empresarial (Business Intelligence), también llamado“Gestión de los Datos” (Data Management).
La idea es que una aplicación ETL lea los datos primarios de unas bases de datos de sistemas principales, realice transformación, validación, el procesocualitativo, filtración y al final escriba datos en el almacén y en este momento los datos son disponibles para analizar por los usuarios.
Herramientas para extraer, transformar y cargar fuentes dedatos.
Componentes:
Sistema ETL (Extraction, Transformation, Load): realiza las funciones de extracción de las fuentes de datos (transaccionales o externas), transformación (limpieza, consolidación,…) y la carga del AD, realizando:
* extracción de los datos.
* filtrado de los datos: limpieza, consolidación, etc.
* carga inicial del almacén: ordenación, agregaciones, etc.
* refrescodel almacén: operación periódica que propaga los cambios de las fuentes externas al almacén de datos.
Repositorio Propio de Datos: información relevante, metadatos.
Interfaces y Gestores deConsulta: permiten acceder a los datos y sobre ellos se conectan herramientas más sofisticadas (OLAP, EIS, minería de datos).
Sistemas de Integridad y Seguridad: se encargan de un mantenimiento global,copias de seguridad etc.
Los más populares herramientas y aplicaciones ETL del mercado
* IBM Websphere DataStage (anteriormente Ascential DataStage y Ardent DataStage)
* Pentaho Data...
Regístrate para leer el documento completo.