Ingeniera

Páginas: 6 (1405 palabras) Publicado: 23 de octubre de 2012
EL CONCEPTO DE DATA MINING

INTRODUCCIÓN

El avance tecnológico hace que las capacidades para generar y almacenar datos se incrementan día a día, donde los factores que influyen son: el uso extendido de los códigos de barras, la automatización de todo tipo de transacciones así como de los avances en la recopilación de datos entre otros.

La evolución de los dispositivos de almacenamientomasivo como discos duros que pueden almacenar gigabytes de información a un precio reducido.

La aparición de un nuevo campo de investigación que se denominó KDD (Knowledge Discovery in Databases) donde se nos menciona que “El proceso no trivial de descubrimiento de patrones válidos, nuevos, potencialmente útiles y comprensibles en grandes volúmenes de datos” y actualmente el nombre que goza demayor aceptación ha sido el de minería de datos o Data Mining.

DESARROLLO

El instituto SAS define al concepto de Data Mining como el proceso de seleccionar, explorar, modificar, modelizar y valorar grandes cantidades de datos con el objetivo de descubrir patrones desconocidos que puedan ser utilizados como ventaja comparativa respecto a los competidores. La idea de que el descubrimiento deconocimiento en bases de datos es un proceso, es decir, que es un conjunto de tareas que se analizarán.

El hecho de complementar el análisis mediante la posibilidad de poder descubrir de forma inductiva información y patrones clave ocultos en los datos es la característica principal del Data Mining, algunos ejemplos son:

a) Predicción automática de tendencias y comportamientos.

b)Descubrimiento automático de patrones previamente desconocidos.

c) Consultas en SQL

El termino de proceso implica que el Data Mining es una conjunción de pasos, es NO trivial ya que se supone que hay que realizar algún tipo de análisis complejo, donde los patrones deben ser comprensibles, sino de manera inmediata, si después de alguna clase de estudio, así mismo se pueden definir medidascuantitativas para evaluar los patrones obtenidos.

Por lo tanto el proceso de Data Mining, es el proceso de aplicar a una determinada base de datos las operaciones requeridas de selección, exploración, muestreo, transformación y métodos de modelado para extraer los patrones y posteriormente evaluarlos para identificar el conjunto de ellos que representarán el conocimiento.

El proceso de KDDes un proceso iterativo porque puede ser necesario acceder desde una fase a cualquiera de las anteriores e interactivo porque el proceso es supervisado y controlado por el usuario de forma directa.

Este proceso consta de cuatro fases:

a) Selección de los objetivos: Hay que estudiar el problema y decidir cuál es la meta del proyecto.

b) Preparación de los datos: Es la etapa que masesfuerzo requiere y consta de:

i) Selección de los datos: Se identifican las fuentes de datos internas o externas y se selecciona el subconjunto de datos necesarios.

ii) Preproceso de los datos: Entender el significado de los atributos y así detectar errores de integración.

iii) Transformación de los datos: Analizado el tipo de problema y el tipo de datos disponible, se selecciona elalgoritmo a aplicar.

c) Construcción del modelo: Se aplican los diferentes algoritmos de análisis de datos sobre los datos transformados y preparados en las etapas anteriores.

d) Análisis de los resultados: Se interpretan y evalúan los resultados obtenidos en la etapa anterior. Se suelen utilizar técnicas de visualización para ver los resultados obtenidos.

En la selección de losobjetivos se valora como se resuelve en el momento presente el problema que se quiere tratar. Las metas deben ser:

a) Cuatificables

b) Realistas

c) Relevantes

d) Lista de prioridades

e) Definición de forma descriptiva clara y sin ambigüedades de los objetivos

Al definir los objetivos se elabora un plan de ejecución que especifique:

a) La duración temporal...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Ingeniera
  • Ingeniera
  • Ingeniera
  • Ingeniera
  • Ingeniera
  • ingeniera
  • ingeniera
  • Ingeniera

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS