Etl

Páginas: 29 (7140 palabras) Publicado: 17 de enero de 2016
11. Herramientas ETL. ¿Que son, para que valen?. Productos mas conocidos. ETL´s Open Source.

Esquema Tipico de Herramienta ETL
Deciamos que las  herramientas de este tipo, deberían de proporcionar, de forma general,  las siguientes funcionalidades:
• Control de la extracción de los datos y su automatización, disminuyendo el tiempo empleado en el descubrimiento de procesos no documentados,minimizando el margen de error y permitiendo mayor flexibilidad.
• Acceso a diferentes tecnologías, haciendo un uso efectivo del hardware, software, datos y recursos humanos existentes.
• Proporcionar la gestión integrada del Data Warehouse y los Data Marts existentes, integrando la extracción, transformación y carga para la construcción del Data Warehouse corporativo y de los Data Marts.

• Uso de laarquitectura de metadatos, facilitando la definición de los objetos de negocio y las reglas de consolidación.
• Acceso a una gran variedad de fuentes de datos diferentes.
• Manejo de excepciones.
• Planificación, logs, interfaces a schedulers de terceros, que nos permitiran llevan una gestión de la planificación de todos los procesos necesarios para la carga del DW.
• Interfaz independiente dehardware.
• Soporte en la explotación del Data Warehouse.
Es hora de ampliar las definiciones y entrar un poco mas a fondo en lo que son realmente las ETL´s
Definición de ETL en la Wikipedia
Si ampliamos las definiciones, en la Wikipedia se dice lo siguiente de las herramientas ETL:
ETL son las siglas en inglés de Extraer, Transformar yCargar (Extract, Transform and Load). Es el proceso que permite alas organizaciones mover datos desde múltiples fuentes, reformatearlos y limpiarlos, y cargarlos en otrabase de datos, data mart, o data warehouse para analizar, o en otro sistema operacional para apoyar un proceso de negocio.
Los procesos ETL también se pueden utilizar para la integración con sistemas heredados (aplicaciones antiguas existentes en las organizaciones que se han de integrar conlos nuevos aplicativos, por ejemplo, ERP´s. La tecnología utilizada en dichas aplicaciones puede hacer dificil la integración con los nuevos programas).
Extraer
La primera parte del proceso ETL consiste en extraer los datos desde los sistemas de origen. La mayoría de los proyectos de almacenamiento de datos fusionan datos provenientes de diferentes sistemas de origen. Cada sistema separado puedeusar una organización diferente de los datos o formatos distintos. Los formatos de las fuentes normalmente se encuentran en bases de datos relacionales o ficheros planos, pero pueden incluir bases de datos no relacionales u otras estructuras diferentes. La extracción convierte los datos a un formato preparado para iniciar el proceso de transformación.
Una parte intrínseca del proceso de extracción esla de analizar los datos extraídos, de lo que resulta un chequeo que verifica si los datos cumplen la pauta o estructura que se esperaba. De no ser así los datos son rechazados.
Un requerimiento importante que se debe exigir a la tarea de extracción es que ésta cause un impacto mínimo en el sistema origen. Si los datos a extraer son muchos, el sistema de origen se podría ralentizar e inclusocolapsar, provocando que éste no pueda utilizarse con normalidad para su uso cotidiano. Por esta razón, en sistemas grandes las operaciones de extracción suelen programarse en horarios o días donde este impacto sea nulo o mínimo.

Interfaz Grafico herramienta ETL
Transformar
La fase de transformación aplica una serie de reglas de negocio o funciones sobre los datos extraídos para convertirlos en datosque serán cargados. Algunas fuentes de datos requerirán alguna pequeña manipulación de los datos. No obstante en otros casos pueden ser necesarias aplicar algunas de las siguientes transformaciones:
Seleccionar sólo ciertas columnas para su carga (por ejemplo, que las columnas con valores nulos no se carguen).
Traducir códigos (por ejemplo, si la fuente almacena una “H” para Hombre y “M” para...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • etl cita
  • Herramientas etl
  • Etl reports
  • Conceptos De Etl
  • documento standard ETL
  • Diseño del Componente ETL
  • Carga Datos ETl
  • Etl sql server

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS