Simulacion

Solo disponible en BuenasTareas
  • Páginas : 11 (2642 palabras )
  • Descarga(s) : 0
  • Publicado : 26 de febrero de 2011
Leer documento completo
Vista previa del texto
Búsqueda de Patrones de Comportamiento en Cubos de Datos

M.en C. Gilberto Lorenzo Martínez Luna, Centro de Investigación en Computación (CIC)
Instituto Politécnico Nacional (IPN) lluna@pollux.cic.ipn.mx

Dr. Adolfo Guzmán Arenas
Centro de Investigación en Computación (CIC)
Instituto Politécnico Nacional (IPN)
aguzman@pollux.cic.ipn.mx

Resumen.
En este trabajo se presenta una formade realizar el descubrimiento de conocimiento o Minería de Datos a partir de una base de datos, la técnica utilizada es la generalización y sumarización de datos en cubos de datos. Se utiliza una herramienta construida en el CIC que permite definir y utilizar los cubos, elegir las regiones de interés de estudio y definir los patrones de comportamiento o situaciones anómalas a localizar en estasregiones. Nuestra herramientas permite programar los procesos de extracción y análisis de datos en horarios nocturnos para aprovechar los recursos computacionales. En la presentación de los resultados de las búsquedas, se busca que esta sea sencilla de revisar e interpretar para descubrir las tendencias o relaciones entre los datos, y así generar conocimiento validado. En este artículo se describeeste desarrollo como una implantación a la tecnología de análisis automático.

1. Introducción

Una definición de Minería de Datos es “el descubrimiento eficiente de información valiosa, no-obvia de una gran colección de datos” [1], cuyo objetivo “es ayudar a buscar situaciones interesantes con los criterios correctos, complementar una labor que hasta ahora se ha considerado “intelectual” y dealto nivel, privativa de los gerentes, planificadores y administradores. Además, de realizar la búsqueda fuera de horas pico, usando tiempos de máquina excedentes” [4]. En general, el proceso de minería se puede ver en la figura 1.

La utilidad de la Minería de Datos ya no se pone a discusión [1][5], por lo cual está tecnología esta siendo aplicada por muchas herramientas de software. Lastécnicas de aplicación varían de acuerdo a la herramienta, algunas la instrumentan haciendo uso de redes neuronales (SPSS Neural Connection), otras con generación de reglas (Data Logic) o Arboles de Decisión [XpertRule Profiler]. En [6] puede verse una clasificación de las herramientas para desarrollar minería, de acuerdo a su técnica de aplicación.

En el Laboratorio de Sistemas de Información delCIC-IPN, se desarrolla una herramienta que forma parte del proyecto ANASIN[1], con la cual la Minería de Datos se realiza utilizando la técnica que construye cubos de n-dimensiones, conocida como generalización y sumarización en cubos de datos [5], técnica implantanda en una base de datos relacional. La generalización de los datos se puede desarrollar en los niveles que se considere necesario usar yasí realizar análisis a diferentes niveles de conceptos. En los cubos formados, la herramienta permite definir regiones de interés en las cuales se buscan patrones de comportamiento [3], al término de la ejecución de las búsquedas los resultados se muestran en reportes de tipo texto y gráficas.

[pic]

Figura 1

En esta parte de la ejecución del proceso de minería se pueden distinguir dostipos de programas, los que extraen la región de interés de la base de minería, llamados extractores; y los programas que realizan la búsqueda de patrones, que se les llama mineros [4]. Tanto la actividad de extracción como la de búsqueda de patrones generalmente pueden consumir demasiado tiempo por la gran cantidad de datos para formar las regiones y los numerosos calculos a realizar, por lo queestas actividades se delegan a programas que las realizan en forma autónoma y nocturna y así lograr aprovechar los recursos computacionales.

El presente documento esta organizado cómo sigue. En la sección 2 se describe en detalle el proceso de minería de datos como lo desarrolla la herramienta construida; en la sección 3 se describe algunos problemas por resolver y hacer más completa la...
tracking img