Ingeniero
Slides from Ernestina Menasalvas
2007/08
El Proceso de KDD
INTERPRETACIÓN Y EVALUACIÓN
DATA MINING
Conocimiento
Modelos
CODIFICACIÓN
Datos Transformados
LIMPIEZA
Datos Procesados
SELECCIÓN
Datos objetivo
Datos
Marta Zorrilla - Universidad de Cantabria
2007/08
29
El ciclo de data mining
Identificar
un problema
Usar datamining para
transformar los datos
en información
Medir los
resultados
Actuar basándonos
en la información
Marta Zorrilla - Universidad de Cantabria
2007/08
30
Importante
La promesa de Data Mining es encontrar los
patrones
Simplemente el hallazgo de los patrones no
es suficiente
Debemos ser capaces de entender los
patrones, responder a ellos, actuar sobre
ellos, parafinalmente convertir los datos en
información, la información en acción y la
acción en valor para la empresa
Marta Zorrilla - Universidad de Cantabria
2007/08
31
Data Mining es un proceso
Data Mining es un proceso que se tiene que
centrar en las acciones derivadas del
descubrimiento de conocimiento no en el
mecanismo de descubrimiento en si mismo.
Aunque los algoritmos sonimportantes, la
solución es más que un conjunto de técnicas
y herramientas.
Las técnicas se tienen que aplicar en el caso
correcto a los datos correctos
Marta Zorrilla - Universidad de Cantabria
2007/08
32
Proyecto: definición
Conjunto de tareas inter-dependientes
Orientadas a un objetivo específico
A realizar en un tiempo y con un coste determinado
Plan de proyecto
MetodologíaModelo de procesos
Ciclo de vida
Marta Zorrilla - Universidad de Cantabria
2007/08
33
Plan de proyecto
Metodología
¿cuándo debe
entregarse?
¿qué entregar?
¿cuánto costará?
Marta Zorrilla - Universidad de Cantabria
¿quién lo hará?
2007/08
34
Metodología
Modelo de
Procesos
Tareas a realizar:
- Desarrollo de las tareas
- Gestión de proyecto de lastareas
+
Ciclo de
vida
Secuencia de las tareas
- En cascada
- Iterativas
Fases del proyecto
Marta Zorrilla - Universidad de Cantabria
2007/08
35
Un posible ciclo de vida
Marta Zorrilla - Universidad de Cantabria
2007/08
36
CRISP-DM: Cross-Industry Standard Process
www.crisp-dm.org
for Data Mining
¿merece la
pena
embarcarse en
el proyecto?
¿es elresultado
valioso para la
aplicación ?
¿tenemos los
datos adecuados
para el proyecto?
¿Son las técnicas
apropiadas para
los resultados que
se esperan?
¿todas las tareas se han 2007/08
realizado correctamente?
Marta Zorrilla - Universidad de Cantabria
37
Data Mining como un proyecto
Definir objetivos:
Corresponde a la fase “business understanding”
Expertos del negocio y de DMdeben definir juntos los objetivos
Cada objetivo debe estar bien definido (detalle)
Obtener los modelos:
Aplicar el modelo de procesos de DM
Evaluar resultados con relación a objetivos:
Evaluar los modelo o patrones de acuerdo con los criterios
especificados
Criterios y medidas para esos objetivos
Implantación:
Si los objetivos de negocio dirigen cada paso, los resultados de DMtendrán impacto en el negocio
Marta Zorrilla - Universidad de Cantabria
2007/08
38
Esfuerzo asociado a cada fase [Cabena 96]
60
50
40
30
20
10
Business
understanding
Marta Zorrilla - Universidad de Cantabria
Data Unders &
preparation
2007/08
Modelling
Evaluation &
deployment
39
Comprensión del problema (I)
Comprensión de los objetivos y
requerimientosdel proyecto desde una
perspectiva de negocio
Convertir este conocimiento en una definición
de un problema de data mining y en un plan
preliminar diseñado para alcanzar los
objetivos
Marta Zorrilla - Universidad de Cantabria
2007/08
40
Comprensión del problema (II). Fases y Salidas
Determinar los objetivos del negocio
Antecedentes
Objetivos del negocio
Criterios de éxito del...
Regístrate para leer el documento completo.