manual de practica de mineria de Datos
EHU-KZAA-TR-1-2010
UNIVERSITY OF THE BASQUE COUNTRY
Department of Computer Science and Artificial Intelligence
Manual de prácticas de minería de datos
usando el software WEKA
Abdelmalik Moujahid e Iñaki Inza
January 2010
San Sebastian, Spain
http://www.ccia-kzaa.ehu.es/
´Indice general
1. Introducci´
on a Weka Explorer
1.1. El entorno Explorer . . . . . . .
1.2. Selecci´ony preparaci´on de datos
1.3. Tareas de procesamiento . . . . .
1.4. Visualizaci´on de los datos . . . .
.
.
.
.
3
3
3
4
5
2. Clasificaci´
on-Introducci´
on
2.1. Algoritmos de clasificaci´on en Weka . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2. Clasificaci´on en Weka . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3. Tareas de clasificaci´on . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . .
6
6
6
7
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3. Introducci´
on a Weka Experimenter
3.1. Detalles sobre la evaluaci´on de una tareade clasificaci´on
3.2. Definir un experimento . . . . . . . . . . . . . . . . . . .
3.3. Guardar un experimento . . . . . . . . . . . . . . . . . .
3.4. Ejecutar un experimento . . . . . . . . . . . . . . . . . .
3.5. Reconfigurar un experimento . . . . . . . . . . . . . . .
3.6. Realizar un experimento . . . . . . . . . . . . . . . . . .
3.7. Analizar los resultados de un experimento . . . . . .. .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
9
9
9
10
10
10
11
11
4. Tareas de miner´ıa de datos
4.1. El clasificador KNN . . . . . .
´
4.2. Arboles
de decisi´on . . . . . . .
4.3. ClasificadoresBayesianos . . .
4.4. Inducci´on de reglas . . . . . . .
4.5. Evaluaci´on de los clasificadores
4.6. Selecci´on de variables (FSS) . .
4.7. Metaclasificadores . . . . . . .
4.7.1. Bagging . . . . . . . . .
4.7.2. Boosting . . . . . . . . .
4.7.3. Stacking . . . . . . . . .
4.8. Algoritmos de Clustering . . .
4.8.1. K-means . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
..
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
13
13
13
14
14
15
16
17
17
17
18
18
19
.
.
.
.
.
.
.
.
..
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Bibliograf´ıa
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
20
2
Cap´ıtulo 1
Introducci´
on a Weka ExplorerWeka (Waikato Environment for Knowledge Analysis) es una herramienta visual de libre distribuci´on (licencia GNU) desarrollada por los investigadores de la Universidad Waikato en Nueva
Zelanda. Es un software que define 4 entornos para el an´alisis y extracci´on de conocimiento a partir
de datos:
Simple CLI: entorno consola para acceder directamente con java a los paquetes de Weka.
Explorer:entorno visual que ofrece una interfaz gr´afica para el uso de paquetes.
Experimenter: entorno que permite configurar un conjunto de experimentos completos y complejos de an´alisis mediante distintos m´etodos de tratamiento y sobre distintos ficheros de datos.
KnowledgeFlow: permite generar proyectos de miner´ıa de datos mediante la generaci´
on de
diagramas de flujos de informaci´on.
1.1.
El...
Regístrate para leer el documento completo.