Mineria de datos
SOFTWARE DE MINERÍA DE DATOS: ANÁLISIS DE CARACTERÍSTICAS
Sandra Mª Sánchez Cañizares
Profesora Ayudante Universidad de Córdoba c/ María Virgen y Madre s/n (Escuela Politécnica Superior)
Miguel Ángel Ayuso Muñoz
Profesor Titular Escuela Universitaria, Universidad de Córdoba c/ María Virgen y Madre s/n (Escuela Politécnica Superior)
José Mª Caridad yOcerin
Catedrático de Universidad (Universidad de Córdoba) Avda. Menéndez Pidal s/n (Escuela Técnica Superior de Ingenieros Agrónomos y Montes)
RESUMEN El presente artículo se propone analizar algunas de las aplicaciones informáticas sobre minería de datos que pueden localizarse actualmente a través de la web. Sobre el estudio de sus características fundamentales se realizará un análisiscluster, agrupándolas en conglomerados relativamente homogéneos, de forma que las herramientas que pertenezcan al mismo grupo, presentarán características y aplicaciones similares. PALABRAS CLAVES
Minería de datos, herramientas informáticas, análisis cluster, conglomerados.
1. INTRODUCCIÓN
Las herramientas informáticas y software de Data Mining en el mercado han visto incrementada su oferta deforma exponencial en los últimos años. Numerosas empresas dedicadas al análisis y creación de bases de datos en búsqueda de información valiosa para el cliente, han desarrollado su propio software de minería de datos para responder a las necesidades de información y búsquedas de asociaciones en los microdatos estudiados. El presente trabajo tiene como propósito realizar un estudio de algunas delas herramientas localizadas a través de la web, para lo cual se examinarán sus principales características y se realizará un análisis clúster que permitirá estructurar en grupos homogéneos aquellos programas que presenten unas aplicaciones semejantes.
2. MINERÍA DE DATOS Y TÉCNICAS ESTADÍSTICAS
La mayoría de herramientas que aplican técnicas de Data Mining para el análisis y la búsqueda detendencias y asociaciones entre los datos de las bases disponibles, emplean ciertos procedimientos estadísticos tales como árboles de decisión, redes neuronales, series temporales, criterios bayesianos, etc. El empleo de estos métodos es indispensable para la clasificación, reducción, simulación, asociación y predicción en los datos. Ello no implica, sin embargo, que los usuarios de lasherramientas de minería de datos existentes necesiten disponer de los conocimientos teóricos y estadísticos asociados a dichos procedimientos. Los
380
Conferência IADIS Ibero-Americana WWW/Internet 2005
entornos en que se desarrollan estos programas suelen presentar una visualización intuitiva y enlaces a través de iconos y ediciones que permiten su uso de forma rápida y sencilla. Sin embargo, seva a tratar aquí de analizar las características y técnicas estadísticas que emplean algunos de estos programas; posteriormente, y tras un análisis clúster de los resultados obtenidos, se agruparán estas herramientas en varios conglomerados de forma que se puedan identificar grupos de técnicas que presentan características similares para el usuario final.
2.1 Programas y CaracterísticasAnalizadas
Los elementos de software que se han analizado son los programas más conocidos y empleados por la comunidad científica y empresarial por sus reconocidas aplicaciones y el prestigio de las compañías que los han desarrollado. Concretamente, se han estudiado 17 programas o aplicaciones relacionadas con la minería de datos. Para cada una de estas aplicaciones, se ha estudiado su empleo o no deciertas herramientas o lenguajes estadísticos y su compatibilidad con ciertas plataformas informáticas. Concretamente, las características analizadas han sido: empleo de redes neuronales; árboles de decisión; k-medias; uso del criterio de Bayes; técnicas estadísticas tradicionales (obtención de los principales estadísticos descriptivos); realización de predicciones; manejo de series de tiempo;...
Regístrate para leer el documento completo.