Modelos de la mineria de datos
Análisis y Extracción de conocimientos
Unidad 1
Fases del proceso KDD
Goretty
23 de Junio del 2011
KDD Knowledge Discovery from Databases
ElKDD es el proceso completo de extracción del conocimiento a partir de bases de datos su término acuñado en 1989 para enfatizar que el conocimiento es el producto final de un proceso de descubrimientoguiado por datos; en la minería de Datos es sólo un paso en el proceso de KDD.
Entre otros aspectos incluye:
* Como son almacenados y accedidos los datos
* Como puede escalarse los algoritmospara trabajar con cantidades de datos enormes y seguir siendo eficientes
* Como puede interpretarse y visualizarse los resultados
* Como modelar ya dar soporte a la intwraccion hombre-maquinadurante todo el proceso
* KDD hace especial enfacis en la búsqueda de modelos/patrones comprensibles
El proceso del KDD contiene:
* El uso de las bases de datos junto con cualquier operaciónde selección, preprocesamiento, sub muestreo y transformaciones de las mismas
* Algoritmos para obtener patrones/modelos a partir de los datos
* Evaluación de os resultados de los algoritmosy selección de aquellos modelos que puedan considerarse conocimiento.
Etapas de la minería de datos KDD:
Las etapas del proceso KDD son las siguientes:
1) Integración y recopilación de datoshay veces la información o datos que necesarios pertenecen a diferentes organizaciones, distintos departamentos e incluso que se requieran datos que nunca hayan sido recolectados en el ámbito de laorganización.
En muchos casos se requerirán datos externos de bases de datos publicas (censos, datos demográficos o climatologicos), o desde base de datos privadas (compañías de pagos, bancarias,eléctricas, etc.) y esto casi es un reto ya que cada fuente de datos usa diferentes:
* Formatos de registro
* Grados de agregación
* Claves primarias
* Tipos de error
2) selección,...
Regístrate para leer el documento completo.