Ingeniería de software

Páginas: 27 (6618 palabras) Publicado: 19 de agosto de 2010
Modelado de procesos ETL para almacenes de datos: un mapeo sistem´tico de estudios a
Lilia Mu˜oz1 , Jos´-Norberto Maz´n2 , and Juan Trujillo2 n e o
Grupo de Investigaci´n Lucentia. Departamento de Sistemas de Informaci´n, o o Control y Evaluaci´n de Recursos Inform´ticos, Universidad Tecnol´gica de Panam´ o a o a Panam´ a lilia.munoz@utp.ac.pa 2 Grupo de Investigaci´n Lucentia, Departamento deLenguajes y Sistemas o Inform´ticos, Universidad de Alicante a Espa˜a n jnmazon,jtrujillo@dlsi.ua.es
1

Resumen En un almac´n de datos, los procesos ETL (Extraction, Transe formation, Load ) se encargan de la extracci´n de datos de las fuentes de o origen que puede contener el almac´n de datos. Un dise˜o correcto de e n estos procesos en las etapas iniciales de un proyecto almacenes de datos esesencial, para evitar tomar malas decisiones como consecuencia de datos incorrectos. A pesar de que se han realizado investigaciones sobre este tema no hay una visi´n clara del actual estado del conocimiento. o En este art´ ıculo se presenta un mapeo sistem´tico de estudios de modea lado de procesos ETL para almacenes de datos. El mapeo resultante da una visi´n general de los trabajos existentessobre modelado de procesos o ETL para almacenes de datos, lo cual permite identificar debilidades y fortalezas de las propuestas y compararlas en base a las caracter´ ısticas, actividades y notaci´n de procesos ETL y la posici´n de futuras investio o gaciones. Keywords: Procesos ETL, modelado, almacenes de datos, mapeo sistem´tico a

1.

Introducci´n o

En los a˜os ’90s, Inmon [2] defini´ elt´rmino Almac´n de Datos (AD) como: n o e e una colecci´n de datos orientados por temas, integrados, variables en el tiempo y o no vol´tiles para el apoyo de la toma de decisiones. Un AD es “integrado”, porque a los datos que se introducen en el almac´n se obtienen de una variedad de fuentes e de datos (sistemas heredados, bases de datos relacionales, ficheros COBOL, etc.). Para lograr la integraci´nde esa variedad de fuentes, se utilizan los procesos ETL. o Dichos procesos son los responsables de la extracci´n de los datos a partir de las o diversas fuentes de datos heterog´neas, de la transformaci´n de estos (conversi´n, e o o limpieza, etc.), y de su carga en el AD. Se reconoce ampliamente que el dise˜o y n mantenimiento de los procesos ETL son factores claves en el ´xito de proyectos ede AD [8,18].

Por su parte, un proceso ETL es extremadamente complejo, propenso a errores y consume mucho tiempo [13]. Se ha argumentado ampliamente, en la literatura, que los procesos ETL son costosos y que son una de las partes m´s a importantes del desarrollo de un AD [2,22]. En [12], se reporta que los costos de herramientas ETL se estiman en al menos la tercera parte de los gastos delpresupuesto de un AD. Por estas razones, as´ como por el alto coste de adquisiı ci´n y mantenimiento, muchas organizaciones prefieren desarrollar sus propios o procesos ETL. Dada la importancia de los procesos ETL dentro del marco de desarrollo de ADs, en este art´ ıculo se pretende brindar una aproximaci´n a trav´s de un o e mapeo sistem´tico de estudios, de cu´les son los diferentes enfoques demodelaa a do de procesos ETL, caracter´ ısticas relevantes de cada uno de ellos, actividades, notaciones y problem´tica presentada en cada enfoque. Es con esta motivaci´n a o que el estudio actual ha surgido de nuestro trabajo para recopilar, mapear y resumir los estudios primarios sobre modelado de procesos ETL para AD de manera precisa, justa y parcial [4]. Un mapeo sistem´tico ofrece una visi´n sisao tem´tica de un ´rea de investigaci´n y permite evaluar la cantidad de pruebas a a o existentes sobre un tema de inter´s [4] (v´ase, por ejemplo de Bailey et al. mapeo e e de estudios [1]). El mapeo sistem´tico de estudios es una metodolog´ que se utiliza con frea ıa cuencia en la investigaci´n m´dica. El objetivo principal de un mapeo sistem´tico o e a de estudios es proporcionar una visi´n...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • ingenieria software
  • Ingenieria De Software
  • Ingenieria De Software
  • Ingenieria De Software
  • Ingenieria De Software
  • Ingenieria de software
  • Ingeniería de Software
  • Ingenieria de software

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS