mineria de datos

Páginas: 15 (3746 palabras) Publicado: 26 de mayo de 2013
InstitutoTecnológico de
Puebla

Del 08 al 12 de octubre de 2007, Puebla, Pue., México

Minería de Datos
I. Olmos-Pineda1, J. A. Gonzalez-Bernal2
1
Universidad Politécnica de Puebla
3er. Carril del Ejido Serrano S/N, San Mateo Cuanalá, Puebla, 72640, México
ivanop_rkl@yahoo.com.mx
2

Instituto Nacional de Astrofísica, Óptica y Electrónica
Luis Enrique Erro No. 1., Sta. MaríaTonantzintla, Puebla, México
jagonzalez@inaoep.mx
Resumen: En este trabajo se presenta una breve
introducción a la minería de datos y al proceso de
extracción de conocimiento en bases de datos. La
finalidad es dar un panorama general sobre los pasos
involucrados en la extracción de conocimiento, que
incluyen desde el pre-procesamiento de los datos,
pasando por la búsqueda o extracción de patrones,hasta
la evaluación, interpretación y visualización de los
resultados. Finalmente se expone un ejemplo del
mundo real en el cual se ha empleado con éxito la
minería de datos.

Introducción
Las bases de datos (BD) surgieron como respuesta a la
necesidad de almacenar datos en un sistema de
cómputo [1]. Al inicio de la era de las computadoras
(década de los 60’s), la dimensión de las basesde datos
se limitaba a unos cuantos KBytes, sujeto a las
restricciones tecnológicas de la época, por lo que su
aplicación a diversos dominios tanto científicos como
del mundo real fue limitado. Sin embargo, con el
avance de la tecnología, pasamos de poder almacenar
unos cuantos Kbytes a cientos de GigasBytes, lo que ha
permitido extender su uso a dominios que antes eran
impensables. Noobstante, el aumento en la dimensión
de las bases de datos ha traído como consecuencia la
necesidad de nuevas herramientas de administración y
análisis que permitan lidiar con la basta cantidad de
datos [2].
El análisis de datos es una tarea que consiste en buscar
o
encontrar
tendencias
o
variaciones
de
comportamiento en los datos, de tal manera que esta
información resulte de utilidadpara los usuarios finales.
A estas tendencias o variaciones se le conocen como
patrón [2]. Si los patrones son útiles y de relevancia
para el dominio, entonces se le llama conocimiento. En

un principio, el análisis se realizaba de forma manual,
empleando técnicas estadísticas. Sin embargo,
actualmente esta forma de análisis resulta inviable por
la gran cantidad de datos que puede conteneruna BD
moderna, además de que existen una gran cantidad de
formatos para los datos, como tablas (bases de datos
relacionales), secuencias [3], grafos [4], imágenes [6],
audio, lo cual aumenta la complejidad de un análisis
manual.
Bajo estas circunstancias es como surge la Minería de
Datos (MD), que es un proceso automático ó semiautomático que busca descubrir patrones ocultos en unconjunto de datos y que además, sean potencialmente
útiles para los usuarios de la BD ([1] y [3]). En la MD
se contemplan diversas estrategias para identificar
diferentes tipos de patrones, como son árboles de
clasificación, redes neuronales, redes bayesianas,
técnicas de asociación, entre otros [8].
El objetivo en todo proceso de MD es obtener patrones
de interés para el usuario final. Paralograrlo, es
necesario preparar correctamente a los datos para
procesarlos, elegir un método adecuado para extraer los
patrones deseados y finalmente, determinar como
evaluar los patrones encontrados. Estas etapas han sido
organizadas en un esquema conocido como el proceso
de descubrimiento de conocimiento en base de datos
(KDD, por sus siglas en inglés), en el cual se
identifican tres grandesbloques: pre-procesamiento,
búsqueda / identificación de patrones y evaluación.
En este trabajo se presenta una breve explicación del
proceso KDD, describiendo brevemente cada una de las
etapas. Finalmente se presenta un caso para la detección
automática de leucemias agudas aplicando el proceso
KDD y la minería de datos.
Pag.

1

InstitutoTecnológico de
Puebla

Del 08 al 12 de...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Mineria de Datos
  • MINERIA DE DATOS
  • Mineria de datos
  • Mineria de datos
  • mineria de datos
  • Mineria de dato
  • Mineria de datos
  • Mineria de datos

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS