Mineria de datos
“Minería de datos”
INTRODUCCIÓN
Aunque desde un punto de vista académico el término data mining es una etapa
dentro de un proceso mayor llamado extracción de conocimiento en bases de
datos, en el entorno comercial, así como en este trabajo, ambos términos se usan
de manera indistinta. Lo que en verdad hace el data mining es reunir las ventajas
de varias áreascomo la Estadística, la Inteligencia Artificial, la Computación
Gráfica, las Bases de Datos y el Procesamiento Masivo, principalmente usando
como materia prima las bases de datos.
Una definición tradicional es la siguiente: Un proceso no trivial de identificación
válida, novedosa, potencialmente útil y entendible de patrones comprensibles que
se encuentran ocultos en los datos (Fayyad y otros,1996).
Desde el punto de vista empresarial, lo definimos como: La integración de un
conjunto de áreas que tienen como propósito la identificación de un conocimiento
obtenido a partir de las bases de datos que aporten un sesgo hacia la toma de
decisión (Molina y otros, 2001).
La idea de data mining no es nueva. Ya desde los años sesenta los estadísticos
manejaban términos como data fishing, data miningo data archaeology con la idea
de encontrar correlaciones sin una hipótesis previa en bases de datos con ruido. A
principios de los años ochenta, Rakesh Agrawal, Gio Wiederhold, Robert Blum y
Gregory Piatetsky-Shapiro, entre otros, empezaron a consolidar los términos de
data mining y KDD. A finales de los años ochenta sólo existían un par de
empresas dedicadas a esta tecnología; en 2002 existenmás de 100 empresas en
el mundo que ofrecen alrededor de 300 soluciones. Las listas de discusión sobre
este tema las forman investigadores de más de ochenta países. Esta tecnología
ha sido un buen punto de encuentro entre personas pertenecientes al ámbito
académico y al de los negocios.
El data mining es una tecnología compuesta por etapas que integra varias áreas y
que no se debe confundir conun gran software. Durante el desarrollo de un
proyecto de este tipo se usan diferentes aplicaciones software en cada etapa que
pueden ser estadísticas, de visualización de datos o de inteligencia artificial,
principalmente. Actualmente existen aplicaciones o herramientas comerciales de
data mining muy poderosas que contienen un sinfín de utilerías que facilitan el
desarrollo de un proyecto. Sinembargo, casi siempre acaban complementándose
con otra herramienta. La data mining es la etapa de descubrimiento en el proceso
de KDD: Paso consistente en el uso de algoritmos concretos que generan una
enumeración de patrones a partir de los datos preprocesados (Fayyad et al., 1996)
Aunque se suelen usar indistintamente los términos KDD y Minería de Datos
La minería de datos o Data Mining puededefinirse inicialmente como un proceso
de descubrimiento de nuevas y significativas relaciones, patrones y tendencias al
examinar grandes cantidades de datos. La disponibilidad de grandes volúmenes
de información y el uso generalizado de herramientas informáticas ha
transformado el análisis de datos orientándolo hacia determinadas técnicas
especializadas englobadas bajo el nombre de minería de datos oData Mining.
Las técnicas de minería de datos persiguen el descubrimiento automático del
conocimiento contenido en la información almacenada de modo ordenado en
grandes bases de datos. Estas técnicas tienen como objetivo descubrir patrones,
perfiles y tendencias a través del análisis de los datos utilizando técnicas
avanzadas como muestreo, análisis exploratorio de datos, técnicas de reducciónde la dimensión, técnicas de modelización avanzada, clasificación, segmentación,
predicción, reconocimiento de patrones y otras técnicas avanzadas de análisis de
datos.
La minería de datos puede definirse inicialmente como un proceso de
descubrimientos de nuevas y significativas relaciones, patrones y tendencias al
examinar grandes cantidades de datos.
La disponibilidad de grandes volúmenes de...
Regístrate para leer el documento completo.