Mineria de Datos
INTRODUCCION A WEKA
El software fue desarrollado por la Universidad de Waikato (Nueva Zelanda) y es una colección de algoritmos, y son implementados en Java. Wekatambién tiene herramientas necesarias para realizar transformaciones sobre los datos, tareas de clasificación, regresión clustering, asociación y visualización.
La licencia de WEKA es GLP* (GNUPublic Licence)
Como podemos observar en la parte superior derecha, encontraremos 4 botones, que se describirán a continuación:
Explorer: Entorno visual que ofrece una interfazgráfica para el uso de los paquetes.
Experimenter: Entorno centrada en la automatización de tareas de manera que se facilite la realización de experimentos a gran escala.
KnowledgeFlow: Nos permitegenerar proyectos de minería de datos mediante la generación de flujos de información.
Simple CLI: Entorno consola para invocar directamente con java a los paquetes de weka
Nos centraremosúnicamente en el explorer:
Debido a que nos permite tener el acceso a la mayoría de las funcionalidades integradas a Weka de una manera fácil
Como podemos observar existen 6 pestañas de ejecución:*Preprocess: Incluye las herramientas y filtros para cargar y manipular los datos
* Classification: Acceso a las técnicas de clasificación y regresión
* Cluster: Integra varios métodos deagrupamiento
* Associate: Incluye unas pocas técnicas de reglas de asociación
* Select Attributes: Permite aplicar diversas técnicas para la reducción del número de atributos
* Visualize: Se puede estudiarel comportamiento de los datos mediante técnicas de visualización.
Como podemos observar, podemos conocer el cuantos registros hay y cuantos atributos tiene, además de conocer cada uno de los valoresmáximo y mínimo por cada uno de sus atributos.
Después de observar lo que nos arroja, al cargar el archivo, observaremos que al darle clic al botón Choose en filter, tendremos acceso a multitud...
Regístrate para leer el documento completo.