hshshs

Páginas: 10 (2312 palabras) Publicado: 7 de agosto de 2014
Búsqueda de Patrones de Comportamiento en Cubos de Datos


M.en C. Gilberto Lorenzo Martínez Luna, Centro de Investigación en Computación (CIC)
Instituto Politécnico Nacional (IPN) lluna@pollux.cic.ipn.mx

Dr. Adolfo Guzmán Arenas
Centro de Investigación en Computación (CIC)
Instituto Politécnico Nacional (IPN)
aguzman@pollux.cic.ipn.mx

Resumen.
En este trabajo se presenta unaforma de realizar el descubrimiento de conocimiento o Minería de Datos a partir de una base de datos, la técnica utilizada es la generalización y sumarización de datos en cubos de datos. Se utiliza una herramienta construida en el CIC que permite definir y utilizar los cubos, elegir las regiones de interés de estudio y definir los patrones de comportamiento o situaciones anómalas a localizar en estasregiones. Nuestra herramientas permite programar los procesos de extracción y análisis de datos en horarios nocturnos para aprovechar los recursos computacionales. En la presentación de los resultados de las búsquedas, se busca que esta sea sencilla de revisar e interpretar para descubrir las tendencias o relaciones entre los datos, y así generar conocimiento validado. En este artículo se describeeste desarrollo como una implantación a la tecnología de análisis automático.

1. Introducción

Una definición de Minería de Datos es “el descubrimiento eficiente de información valiosa, no-obvia de una gran colección de datos” [1], cuyo objetivo “es ayudar a buscar situaciones interesantes con los criterios correctos, complementar una labor que hasta ahora se ha considerado “intelectual” yde alto nivel, privativa de los gerentes, planificadores y administradores. Además, de realizar la búsqueda fuera de horas pico, usando tiempos de máquina excedentes” [4]. En general, el proceso de minería se puede ver en la figura 1.

La utilidad de la Minería de Datos ya no se pone a discusión [1][5], por lo cual está tecnología esta siendo aplicada por muchas herramientas de software. Lastécnicas de aplicación varían de acuerdo a la herramienta, algunas la instrumentan haciendo uso de redes neuronales (SPSS Neural Connection), otras con generación de reglas (Data Logic) o Arboles de Decisión [XpertRule Profiler]. En [6] puede verse una clasificación de las herramientas para desarrollar minería, de acuerdo a su técnica de aplicación.

En el Laboratorio de Sistemas de Información delCIC-IPN, se desarrolla una herramienta que forma parte del proyecto ANASIN1, con la cual la Minería de Datos se realiza utilizando la técnica que construye cubos de n-dimensiones, conocida como generalización y sumarización en cubos de datos [5], técnica implantanda en una base de datos relacional. La generalización de los datos se puede desarrollar en los niveles que se considere necesario usary así realizar análisis a diferentes niveles de conceptos. En los cubos formados, la herramienta permite definir regiones de interés en las cuales se buscan patrones de comportamiento [3], al término de la ejecución de las búsquedas los resultados se muestran en reportes de tipo texto y gráficas.




Figura 1


En esta parte de la ejecución del proceso de minería se pueden distinguir dostipos de programas, los que extraen la región de interés de la base de minería, llamados extractores; y los programas que realizan la búsqueda de patrones, que se les llama mineros [4]. Tanto la actividad de extracción como la de búsqueda de patrones generalmente pueden consumir demasiado tiempo por la gran cantidad de datos para formar las regiones y los numerosos calculos a realizar, por lo queestas actividades se delegan a programas que las realizan en forma autónoma y nocturna y así lograr aprovechar los recursos computacionales.

El presente documento esta organizado cómo sigue. En la sección 2 se describe en detalle el proceso de minería de datos como lo desarrolla la herramienta construida; en la sección 3 se describe algunos problemas por resolver y hacer más completa la...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • hshshs
  • Hshshs
  • hshshs
  • hshshs
  • hshshs
  • hshshs
  • hshshs
  • Hshshs

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS