El etl

Solo disponible en BuenasTareas
  • Páginas : 7 (1535 palabras )
  • Descarga(s) : 0
  • Publicado : 24 de febrero de 2011
Leer documento completo
Vista previa del texto
MICRO PLANEACION DE ACTIVIDADES POR RESULTADOS DE APRENDIZAJE

SOLUCION

1.

EL ETL, DEPENDIENDO DE SU LICENCIA, PLATAFORMA, FUNCIONALIDADES Y COSTO

Es el proceso que permite a las organizaciones mover datos desde múltiples fuentes, reformatearlos y limpiarlos, y cargarlos en otra base de datos, data mart, o data warehouse para analizar, o en otro sistema operacional para apoyarun proceso de negocio.
Los procesos ETL también se pueden utilizar para la integración con sistemas heredados.

-------------------------------------------------
Extraer
-------------------------------------------------
a primera parte del proceso ETL consiste en extraer los datos desde los sistemas de origen. La mayoría de los proyectos de almacenamiento de datos fusionan datos provenientes dediferentes sistemas de origen. Cada sistema separado puede usar una organización diferente de los datos o formatos distintos. Los formatos de las fuentes normalmente se encuentran enbases de datos relacionales o ficheros planos, pero pueden incluir bases de datos no relacionales u otras estructurasdiferentes. La extracción convierte los datos a un formato preparado para iniciar el proceso detransformacón.
Una parte intrínseca del proceso de extracción es la de analizar los datos extraídos, de lo que resulta un chequeo que verifica si los datos cumplen la pauta o estructura que se esperaba. De no ser así los datos son rechazados.
Un requerimiento importante que se debe exigir a la tarea de extracción es que ésta cause un impacto mínimo en el sistema origen. Si los datos a extraer son muchos,el sistema de origen se podría ralentizar e incluso colapsar, provocando que éste no pueda utilizarse con normalidad para su uso cotidiano. Por esta razón, en sistemas grandes las operaciones de extracción suelen programarse en horarios o días donde este impacto sea nulo o mínimo.
-------------------------------------------------

--------------------------------------------------------------------------------------------------

-------------------------------------------------
Transformar
La fase de transformación aplica una serie de reglas de negocio o funciones sobre los datos extraídos para convertirlos en datos que serán cargados. Algunas fuentes de datos requerirán alguna pequeña manipulación de los datos. No obstante en otros casos pueden ser necesarias aplicar algunas delas siguientes transformaciones:
* Seleccionar sólo ciertas columnas para su carga (por ejemplo, que las columnas con valores nulos no se carguen).
* Traducir códigos (por ejemplo, si la fuente almacena una "H" para Hombre y "M" para Mujer pero el destino tiene que guardar "1" para Hombre y "2" para Mujer).
* Codificar valores libres (por ejemplo, convertir "Hombre" en "H" o "Sr" en"1").
* Obtener nuevos valores calculados (por ejemplo, total_venta = cantidad * precio).
* Unir datos de múltiples fuentes (por ejemplo, búsquedas, combinaciones, etc.).
* Calcular totales de múltiples filas de datos (por ejemplo, ventas totales de cada región).
* Generación de campos clave en el destino.
* Transponer o pivotar (girando múltiples columnas en filas o viceversa).* Dividir una columna en varias (por ejemplo, columna "Nombre: García, Miguel"; pasar a dos columnas "Nombre: Miguel" y "Apellido: García").
* La aplicación de cualquier forma, simple o compleja, de validación de datos, y la consiguiente aplicación de la acción que en cada caso se requiera:
* Datos OK: Entregar datos a la siguiente etapa (Carga).
* Datos erróneos: Ejecutarpolíticas de tratamiento de excepciones (por ejemplo, rechazar el registro completo, dar al campo erróneo un valor nulo o un valor centinela).
-------------------------------------------------
Carga
La fase de carga es el momento en el cual los datos de la fase anterior (transformación) son cargados en el sistema de destino. Dependiendo de los requerimientos de la organización, este proceso puede...
tracking img