Rapid miner

Páginas: 7 (1732 palabras) Publicado: 27 de agosto de 2014
Introducción a RAPIDMINER
Fuentes:
Esta guía ha sido adaptada del curso de Gregory Piatetsky-Shapiro disponible en KDnuggets.
Los datos han sido tomados de http://ftp.ics.uci.edu/pub/machine-learning-databases/thyroid-disease/ y de http://www-users.cselabs.umn.edu/classes/Fall-2011/csci5523
El sitio oficial de RapidMiner http://rapid-i.com/ y el sitio http://rapidminerresources.com/contienen otros recursos y documentación.
En este práctico aplicaremos algunos esquemas básicos de aprendizaje con valores por defecto en sus parámetros, para analizar varios conjuntos de datos y evaluaremos la calidad de los modelos aprendidos. A medida que vaya evaluando los modelos registre los resultados para elaborar una tabla que será entregada al final del práctico. (Fíjese en el esquema de latabla que aparece al final del práctico para hacerse una idea de la tarea).
Archivos de datos:
datos sobre jugar o no según el tiempo meteorológico: clima.csv
datos sobre cómo clasificar un conjunto de clientes: clientes.xlsx
datos sobre enfermos de tiroides: tiroides.xls (descripción en tiroides.txt)
La primera vez que se ejecuta RapidMiner le pedirá que cree un repositorio. Asegúrese deelegir como ubicación del mismo una carpeta en la que ud tenga derechos de escritura. De lo contrario posteriormente saldrán errores cuando RapidMiner quiera guardar su trabajo.

Vamos a comenzar importando los datos del archivo clima.csv en RapidMiner. Esto puede hacerse de dos maneras:
importando el archivo de datos con un operador (Read CSV, Read Excel, Read ARFF, etc),
creando unrepositorio.
La versión actual de RapidMiner recomienda la segunda opción para aprovechar algunas de sus mejoras, y la que vamos a utilizar ahora. En otros prácticos utilizaremos la primera opción.

En la parte izquierda de la perspectiva de diseño tiene dos paneles que se superponen: operadores y repositorios. Para crear un repositorio a partir de un archivo seleccione el panel de repositorios y hagaclic en la flecha que está junto al botón de importar. El archivo de datos clima.csv está en formato CSV: valores separados por comas. En realidad los valores pueden estar separados por , o por ; dependiendo de cómo fue creado el archivo. Inspecciónelo primero con Microsoft Excel o con un editor de textos para familiarizarse con los atributos y sus valores.
Luego impórtelo: siga los pasospropuestos asegurándose de que las columnas de datos están adecuadamente separadas.

En el paso siguiente indique a RapidMiner que la primera fila del archivo contiene los nombres de los atributos, como sigue.

En la siguiente pantalla (paso) RapidMiner puede decidir automáticamente el tipo de sus datos, utilizando el botón Guess Value Types. Verifique que los tipos son adecuados. En nuestroproblema, el atributo “Jugar” va a ser el atributo de clase, es decir el que se va a utilizar para construir el modelo como clasificador y sobre el que se harán predicciones para nuevos datos. Márquelo como tal, indicando que es del tipo “label”. Los restantes atributos son “attribute
”.
Dé un nombre al repositorio (“clima”) y guárdelo. Aparecerá con un pequeño icono representando un repositorio. Elotro tipo de iconos que ve son los “procesos” (rueda dentada), la secuencia de operaciones de minería de datos (limpieza, transformación, aprendizaje de modelos, evaluación…) que vamos aplicando a los datos y que pueden ser también almacenadas.
Ahora estamos listos para comenzar a crear nuestro proceso de aprendizaje. Lo iremos construyendo en la ventana Main Process. Arrastre a ese espacio elrepositorio con los datos del clima. Automáticamente se añade un operador (“retrieve”) al proceso.
Vamos a comenzar con el aprendizaje de árboles de decisión. Cambie al panel de operadores y añada un operador “decision tree” al proceso. Para encontrarlo rápidamente, introduzca parte de su nombre en la ventana de búsqueda de operadores.
Haga clic en Decision tree y arrástrelo a la ventana del...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Rapid Miner
  • Rapid Miner
  • rapido
  • el rap
  • el rap
  • El rap
  • Rapido
  • el rap

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS