asd de las vida
Clementine
Seminario
“Data Mining”
Máster en Ingeniería del Software del DSIC
José Hernández Orallo. (jorallo@dsic.upv.es). Noviembre 2002
Objetivos:
Los objetivos principales de este laboratorio son:
•
Aprender a manejar la herramienta de minería de datos SPSS Clementine: obtener y transformar
datos, generar modelos y evaluarlos.
•Aplicarla para distintos tipos de problemas de minería de datos: descriptivos y predictivos.
El tiempo estimado para realizar este boletín es de cuatro horas (sin incluir los ejercicios libres).
Índice
1.
Introducción al SPSS Clementine ................................................................................................................... 3
1.1
Sources(Orígenes) .................................................................................................................................. 4
1.2
Record Ops. (Oper. con registros)........................................................................................................... 5
1.3
Field Ops. (Oper. concampos)................................................................................................................ 5
1.4
Graph (Gráficos) ..................................................................................................................................... 5
1.5
Modelling (Modelado) ............................................................................................................................ 6
1.6
Output (Salida)........................................................................................................................................ 7
2. Un primer ejemplo .......................................................................................................................................... 8
3. Visualización y Preparación deDatos........................................................................................................... 15
3.1
Enunciado de un Primer Problema. Selección de Fármaco................................................................... 15
3.2
Resolución del Problema de Selección de Fármaco.............................................................................. 15
3.3
Un Segundo Problema: Agrupación de Empleados.............................................................................. 23
3.4
Resolución del Problema de Agrupación de Empleados....................................................................... 23
3.5
Obtención y Transformación de Datos Relacionales ............................................................................ 26
4. Validación de Modelos................................................................................................................................. 36
4.1.1
Cross-Validation ........................................................................................................................... 37
4.1.2
Sampling & Boosting.................................................................................................................... 39
5. Patrones Predictivos...................................................................................................................................... 43
5.1
Patrones Secuenciales ........................................................................................................................... 43
5.2Clasificación.......................................................................................................................................... 44
5.2.1
Varios modelos para los medicamentos ........................................................................................ 44
5.2.2
Varios modelos para el monks1 .................................................................................................... 44
6. Patrones...
Regístrate para leer el documento completo.