trabajo etica
EL PROCESO DE KDD
El proceso de KDD consiste en usar métodos de minería de datos(algoritmos) para extraer (identificar) lo que se considera como conocimiento de acuerdo a laespecificación de ciertos parámetros usando una base de datos junto con preprocesamientos y post-procesamientos. En la figura2.2 de la pagina 9se ilustra el proceso de KDD.
Se estima que laextracción de patrones (minería) de los datos ocupa solo el 15% - 20% del esfuerzo total del proceso de KDD.
El proceso de descubrimiento de conocimiento en bases de datos involucra varios pasos:
•Determinar las fuentes de información: que pueden ser útiles y dónde conseguirlas.
Proceso de KDD
• Diseñar el esquema de un almacén de datos (Data Warehouse): que consiga unificar de maneraoperativa toda la información recogida.
• Implantación del almacén de datos: que permita la navegación y visualización previa de sus datos, para discernir qué aspectos puede interesar que seanestudiados. Esta es la etapa que puede llegar a consumir el mayor tiempo.
• Selección, limpieza y transformación de los datos que se van a analizar: la selección incluye tanto una criba o fusión horizontal(filas) como vertical (atributos).La limpieza y prepocesamiento de datos se logra diseñando una estrategia adecuada para manejar ruido, valores incompletos, secuencias de tiempo, casos extremos (si esnecesario), etc.
• Seleccionar y aplicar el método de minería de datos apropiado: esto incluye la selección de la tarea de descubrimiento a realizar, por ejemplo, clasificación, agrupamiento oclustering, regresión, etc. La selección de él o de los algoritmos a utilizar. La transformación de los datos al formato requerido por el algoritmo específico de minería de datos. Y llevar a cabo elproceso de minería de datos, se buscan patrones que puedan expresarse como un modelo o simplemente que expresen dependencias de los datos, el modelo encontrado depende de su función (clasificación) y...
Regístrate para leer el documento completo.