Kiubo

Solo disponible en BuenasTareas
  • Páginas : 8 (1920 palabras )
  • Descarga(s) : 0
  • Publicado : 14 de octubre de 2010
Leer documento completo
Vista previa del texto
Minería de datos aplicada a la detección de diabetes
Resumen
En este trabajo se presenta una breve introducción a la minería de datos y al proceso de extracción de conocimiento en bases de datos. La finalidad es dar un panorama general sobre los pasos involucrados en la extracción de conocimiento, que incluyen desde el pre-procesamiento de los datos, pasando por la búsqueda o extracción depatrones, hasta la evaluación, interpretación y visualización de los resultados. Finalmente se expone un ejemplo del mundo real en el cual se ha empleado con éxito la minería de datos.
Introducción
Las bases de datos surgieron como respuesta a la necesidad de almacenar datos en un sistema de cómputo. [1] Al inicio de la era de las computadoras (década de los 60’s), la dimensión de las bases de datosse limitaba a unos cuantos KBytes, sujeto a las restricciones tecnológicas de la época, por lo que su aplicación a diversos dominios tanto científicos como del mundo real fue limitado. Sin embargo, con el avance de la tecnología, pasamos de poder almacenar unos cuantos Kbytes a cientos de GigasBytes, lo que ha permitido extender su uso a dominios que antes eran impensables. No obstante, elaumento en la dimensión de las bases de datos ha traído como consecuencia la necesidad de nuevas herramientas de administración y análisis que permitan lidiar con la basta cantidad de datos [2].
El análisis de datos es una tarea que consiste en buscar o encontrar tendencias o variaciones de comportamiento en los datos, de tal manera que esta información resulte de utilidad para los usuarios finales. Aestas tendencias o variaciones se le conocen como patrón. Si los patrones son útiles y de relevancia para el dominio, entonces se le llama conocimiento. En un principio, el análisis se realizaba de forma manual, empleando técnicas estadísticas. Sin embargo, actualmente esta forma de análisis resulta inviable por la gran cantidad de datos que puede contener una bases de datos moderna, además de queexisten una gran cantidad de formatos para los datos, como tablas (bases de datos relacionales), secuencias, grafos, imágenes, audio, lo cual aumenta la complejidad de un análisis manual [2].
Bajo estas circunstancias es como surge la minería de datos, que es un proceso automático ó semi-automático que busca descubrir patrones ocultos en un conjunto de datos y que además, sean potencialmenteútiles para los usuarios de la bases de datos. En la minería de datos se contemplan diversas estrategias para identificar diferentes tipos de patrones, como son árboles de clasificación, redes neuronales, redes bayesianas, técnicas de asociación, entre otros [1 y 3].
El objetivo en todo proceso de minería de datos es obtener patrones de interés para el usuario final. Para lograrlo, es necesariopreparar correctamente a los datos para procesarlos, elegir un método adecuado para extraer los patrones deseados y finalmente, determinar como evaluar los patrones encontrados. Estas etapas han sido organizadas en un esquema conocido como el proceso de descubrimiento de conocimiento en base de datos (KDD, por sus siglas en inglés), en el cual se identifican tres grandes bloques: pre-procesamiento,búsqueda / identificación de patrones y evaluación.
Concepto
La minería de datos es el proceso que tiene como propósito descubrir, extraer y almacenar información relevante de amplias bases de datos, a través de programas de búsqueda e identificación de patrones y relaciones globales, tendencias, desviaciones y otros indicadores aparentemente caóticos que tienen una explicación que puedendescubrirse mediante diversas técnicas de esta herramienta.
El objetivo fundamental es aprovechar el valor de la información localizada y usar los patrones preestablecidos para que el interesado tenga un mejor conocimiento de ése cumulo de datos y tomar decisiones más confiables [4].

Etapas en el Proceso KDD
El proceso KDD, ilustrado en la Figura 1, está dividido en una serie de pasos, desde la...
tracking img