Manual de weka

Solo disponible en BuenasTareas
  • Páginas : 8 (1911 palabras )
  • Descarga(s) : 0
  • Publicado : 21 de marzo de 2011
Leer documento completo
Vista previa del texto
Práctica de Minería de Datos
Introducción al

Curso de Doctorado Extracción Automática de Conocimiento en Bases de Datos e Ingeniería del Software
Universitat Politècnica de València
José Hernández Orallo. (jorallo@dsic.upv.es). Marzo 2006 Cèsar Ferri Ramírez. (cferri@dsic.upv.es). Marzo 2006

Índice
El entorno de trabajo del Weka............................................................................................................................. 2 1.1 Explorer .......................................................................................................................................................... 3 2. Un primerejemplo.................................................................................................................................................. 4 3. Un problema de clasificación ................................................................................................................................ 8 3.1 Enunciado del problema. Selección de Fármaco ......................................................................................... 8 3.2 Resolución del problema............................................................................................................................... 9 3.3 Filtrado de atributos .....................................................................................................................................11 3.4 Aprendizaje Sensible al Coste.....................................................................................................................13 3.5Combinación de Modelos............................................................................................................................14 4. Un problema de agrupación.................................................................................................................................15 4.1 Enunciado: Agrupación deEmpleados.......................................................................................................15 4.2 Resolución del Problema.............................................................................................................................15 5. Reglas de Asociación y Dependencias ................................................................................................................16 En esta práctica se vamos a descubrir paso apaso las posibilidades del Weka utilizando ejemplos muy sencillos y sin realizar validaciones apropiadas de los modelos extraídos. El objetivo de este boletín es manejarse con cierta soltura en el Weka. 1.

1. El entorno de trabajo del Weka
Weka1 es un conjunto de librerias JAVA para la extracción de conocimientos desde bases de datos. Es un software ha sido desarrollado bajo licencia GPL lo cualha impulsado que sea una de las suites más utilizadas en el área en los últimos años. La versión 3.4.7 incluye las siguientes características: • • • Diversas fuentes de datos (ASCII, JDBC). Interfaz visual basado en procesos/flujos de datos (rutas). Distintas herramientas de minería de datos: reglas de asociación (a priori, Tertius, ...), , agrupación/segmentación/conglomerado (Cobweb, EM yk-medias), clasificación (redes neuronales, reglas y árboles de decisión, aprendizaje Bayesiona) y regresión (Regresión lineal, SVM..). Manipulación de datos (pick & mix, muestreo, combinación y separación). Combinación de modelos (Bagging, Boosting ...) Visualización anterior (datos en múltiples gráficas) y posterior (árboles, curvas ROC, curvas de coste..). Entorno de experimentos, con la posibilidadde realizar pruebas estadísticas (t-test).

• • • •

1

http://www.cs.waikato.ac.nz/~ml/weka/index.html

2

Figura 1. Ventana inicial de Weka.

Como se puede ver en la parte inferior de la Figura 1, Weka define 4 entornes de trabajo • • • • Simple CLI: Entorno consola para invocar directamente con java a los paquetes de weka Explorer: Entorno visual que ofrece una interfaz gráfica...
tracking img