Data Mining & Agentes

Páginas: 9 (2207 palabras) Publicado: 25 de noviembre de 2012
RESUMEN
La transformación de grandes cantidades de datos en información útil y conocimiento es una inminente necesidad para la industria de la información. Buscando cubrir esta necesidad surge el proceso de descubrimiento de conocimiento en bases de datos (Knowledge Discovery in Databases, KDD), el cual está compuesto por varias etapas. Dentro de estas etapas se tiene un conjunto conocido comopreparación de datos en el cual actualmente se concentra la mayor parte del esfuerzo destinado en las organizaciones al proceso de KDD, esto dificulta considerablemente el desarrollo a fondo de las etapas de adquisición de conocimiento tales como Minería de Datos y evaluación e interpretación de patrones. En esta propuesta de tesis se plantea un modelo basado en agentes de software para dos etapasde la preparación de datos (Recopilación e integración), que permita reducir el esfuerzo asignado a estas etapas, automatizando en la medida de lo posible sus procesos y aumentando la calidad de los resultados de los mismos.
PALABRAS CLAVES
Descubrimiento de Conocimiento en Bases de Datos (KDD), Sistemas Multi-Agente (SMA), Integración de datos, Recopilación de datos.
INTRODUCCIÓN
Eldesarrollo de la tecnología ha permitido en la industria de la información y en la sociedad en general la generación y el almacenamiento de grandes cantidades de datos. La transformación de estos datos en información útil y conocimiento es una inminente necesidad, debido a la gran utilidad que proporciona la adquisición de conocimiento desconocido o la corroboración de creencias sobre un entorno. Con elfin de suplir esta falencia surge el proceso de descubrimiento de conocimiento en bases de datos (Knowledge Discovery in Databases, KDD).

Este proceso iterativo e interactivo consta de varias etapas que envuelven desde la preparación de los datos hasta la interpretación de patrones adquiridos. Sin embargo durante el desarrollo de KDD, la mayor parte del tiempo y trabajo se concentra en lapreparación de los datos, evitando que se destine un mayor esfuerzo a las etapas de adquisición de conocimiento tales como Minería de datos y evaluación e interpretación de patrones, etapas que representan fundamentalmente el objetivo del KDD.

Hasta hace varios años lo principales avances en investigación en KDD se centraban en las técnicas de Minería de datos. Ya en los años recientes debido alhecho de que mucho trabajo en el campo de minería de datos está basado en la existencia de datos de calidad (calidad que no se tiene generalmente, debido a la naturaleza impura de los datos producidos en mundo real) se comenzaron a realizar grandes esfuerzos en el área de la Preparación de los datos, con el fin de obtener precisamente datos de calidad adecuados para la aplicación de estastécnicas.

Aun así, la preparación de datos es un área muy amplia y las principales investigaciones académicas se han concentrado en las siguientes áreas: La selección, la transformación, la limpieza y la reducción de datos, dejando un poco descuidadas las fases de Recopilación e Integración de datos. Sin embargo el desarrollo de esta últimas se ha logrado en el ámbito privado, donde se ha realizadoun trabajo relativamente fuerte que ha dado grandes resultados, no obstante los diferentes modelos creados y soluciones propuestas en su mayor parte no son de dominio público.

Las diferencias en los desarrollos con respecto a las otras etapas de la preparación de datos y la imposibilidad en el acceso a muchos desarrollos privados, son algunas de las motivaciones que fundamentan la propuesta deeste modelo para el desarrollo de las etapas de recopilación e integración de datos dentro del proceso de KDD.
MARCO TEÓRICO
El KDD puede definirse como un proceso no trivial que busca identificar patrones válidos, novedosos, potencialmente útiles y en última instancia comprensibles a partir de los datos [Fayyad et al, 1996] [Cios et al, 2007]. A continuación en la Figura 1 se muestran las...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Data mining
  • Data Mining
  • Data Mining
  • data mining
  • Data mining
  • Data Mining
  • DATA MINING
  • Data Mining

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS