Tutorial Weka

Páginas: 8 (1786 palabras) Publicado: 29 de septiembre de 2011
Tutorial Weka 3.6.0 Ricardo Aler 2009 Contenidos:
0. Descarga 1. Entrar al programa 2. El Explorer: 2.0. El Explorer: Preprocesamiento (preprocess) 2.1. El Explorer, Clasificación (classify) 2.2. El Explorer, Selección de atributos (Attribute Selection, visualization) 3. El Experimenter

0. Descarga
Weka es una herramienta de dominio público escrita en Java que se puede descargar de estadirección: http://www.cs.waikato.ac.nz/~ml/weka/ Este tutorial se centra en la versión 3.6.0 y su objetivo es dar un conocimiento básico de Weka. Se puede obtener información más detallada bien en la URL anterior, bien en el libro de Weka “Data Mining: Practical Machine Learning Tools and Techniques (Second Edition)” de Witten y Frank. Aunque no va a ser necesario para este tutorial, en ocasiones esimportante incrementar la cantidad de memoria que Weka puede utilizar. Esto se puede hacer creando un fichero .bat (en Windows) como este:
@echo off javaw -Xmx1024m -classpath "C:\Program Files (x86)\Weka-3-6\weka.jar" weka.gui.Main

para ello habrá que localizar previamente el directorio donde está instalado el .jar de Weka. El script anterior le da a Weka 1 Giga de memoria (1024 MB). Pero nova a ser necesario hacer este cambio para el tutorial.

1. Entrar al programa
La primera pantalla de Weka muestra una serie de opciones en su parte superior. La mas importante es Applications, donde se pueden ver las distintas subherramientas de Weka. Las más importantes son Explorer (para explorar los datos) y Experimenter (para realizar experimentos que comparen estadísticamente distintosalgoritmos en distintos conjuntos de datos, de manera automatizada). De momento usaremos el Explorer.

2. 0. El Explorer: preprocesamiento (preprocess)
El Explorer permite visualizar y aplicar distintos algoritmos de aprendizaje a un conjunto de datos. Cada una de las tareas de minería de datos viene representada por una pestaña en la parte superior. Estas son: • Preprocess: visualización ypreprocesado de los datos (aplicación de filtros) • Classify: Aplicación de algoritmos de clasificación y regresión • Cluster: Agrupación • Associate: Asociación • Select Attributes: Selección de atributos • Visualize: Visualización de los datos por parejas de atributos

A partir de aquí usaremos el fichero iris.arff, que ya viene en el formato de datos de Weka (formato arff). El objetivo de estedominio es construir un clasificador que permita clasificar plantas en tres clases: setosa, versicolor y virgínica, en términos de la longitud y anchura de pétalos y sépalos. Cargaremos el fichero con la opción Open File (arriba a la izquierda). Existen otras opciones para cargar datos desde una página web, desde una base de datos, o incluso para generar datos artificiales adaptados a clasificadoresconcretos, pero no utilizaremos esas posibilidades aquí. Podemos observar como en la parte izquierda se nos da información sobre el número de datos o instancias (150) y el número de atributos (5 = 4 mas la clase). También en la parte izquierda tenemos el nombre de los atributos. En la parte superior derecha aparece información estadística sobre los atributos (media, desviación típica, valoresmáximo y mínimo, Unique se refiere al número de valores que sólo aparecen una vez en ese atributo y disctinct al número de valores distintos (o sea, excluyendo los valores repetidos). Un poco mas abajo, aparece el desglose de los valores del atributo por clase. En el eje X aparecen los valores del atributo seleccionado en la parte de la izquierda (ahora mismo, el atributo seleccionado es elsepallength, aunque podría ser cualquier otro). Recordemos que hay tres posibles clases, que en el gráfico aparecen representadas con los colores azul oscuro, rojo y azul claro.

Selección de filtros para los datos

Estadísticas de los datos Desglose del atributo seleccionado en la izquierda

Nombres de atributos

Si queremos podemos visualizar el desglose de todos los atributos a la vez. Si hay...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Tutorial para herramienta Weka
  • Weka
  • Weka
  • WEKA
  • weka
  • Weka
  • Weka
  • Problema Weka

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS