Mineria De Datos Con Weka

Páginas: 15 (3519 palabras) Publicado: 29 de agosto de 2011
Manual de Weka
Si se tienen datos y se quiere construir un árbol de decisión. Los datos pueden ser almacenados en una hoja de cálculo o base de datos. Sin embargo, Weka espera que estén en formato de ARFF
INTERFACES DE USUARIO (las formas de trabajar con Weka)
1. Simple CLI .- Intérprete de comandos o “consola”
2. Explorer: Interfaz gráfico principal Proporciona acceso a las distintasfuncionalidades a través de menús y formularios de datos
3. Experimenter: Automatiza el proceso de ejecución de varios filtros y clasificadores con diferentes parámetros sobre un conjunto de datos y proporciona estadísticas de dicho proceso
• Permite comparar rendimientos y distribuir la carga de trabajo entre varias máquinas (experimentos grandes).
4. KnowledgeFlow: Similar al funcionamiento internodel programa, Permite crear una secuencia o “circuito” que recoge todo el experimento.
Archivos que pueden abrirse en WEKA
ARFF (Attribute-Relation File Format.)(Formato de Archivo de Atributo Relacion)
GZ identifica los archivos comprimidos Gzip
CSV 1. Pueden generarse a partir de una hoja de cálculo
2. una consulta a una base de datos.
3. WEKA los convierte al formato ARFFautomáticamente.

1. Lo anterior es posible a través de utilizar Excel o Word y guardar el archivo con extensión CSV (delimitado por comas), en donde cada campo es separado por las comas (,), aparece un mensaje de precaución, pulsar OK.
2. Inmediatamente después lo único que se requiere es abrir un documento de texto (Word), y ahí cargar el archivo creado en Excel.
Después es necesario agregar lassiguientes etiquetas a los datos que aparecen en word.
1 @relation Nombre del archivo en Excel
2 @attribute Los atributos como pueden ser (nombre, edad, domicilio)
3 @data Los datos como (enrique, 31, colon 107-b)

1. Cabecera. Se define el nombre de la relación. Su formato es el siguiente:
@relation
Donde es de tipo String*. Si dicho nombre contiene algún espacio será necesario expresarloentrecomillado.
2. Declaraciones de atributos. En esta sección se declaran los atributos que compondrán nuestro archivo junto a su tipo. La sintaxis es la siguiente:
@attribute
Donde es de tipo String teniendo las mismas restricciones que el caso anterior. Weka acepta diversos tipos, estos son: numeric, integer, date, String, enumerado
3. Sección de datos. Declaramos los datos que componen larelación separando entre comas los
atributos y con saltos de línea las relaciones.
@data 4,3.2
Aunque éste es el modo “completo" es posible definir los datos de una forma abreviada (sparse data). Si tenemos una muestra en la que hay muchos datos que sean 0 podemos expresar los datos prescindiendo de los elementos que son nulos, rodeando cada una de las filas entre llaves y situando delante de cadauno de los datos el número de atributo**. Un ejemplo de esto es el siguiente
@data {1 4, 3 3}
Después de hacer lo anterior se debe guardar el documento de la siguiente manera:
1. Guardar como texto
2. Después es necesario renombrar el archivo con extensión . ARFF (Attribute-Relation
File Format.)(Formato de Archivo de Atributo Relacion).
De esta manera es posible empezar a analizar los datoscon WEKA.
En el caso de que algún dato sea desconocido se expresará con un símbolo de cerrar interrogación (“?").
Es posible añadir comentarios con el símbolo “ %”, que indicará que desde ese símbolo hasta el final de la línea es todo un comentario. Los comentarios pueden situarse en cualquier lugar del fichero. Ejem:
% Archivo de prueba para Weka.
Al abrir el entorno de Weka, y elegirExplorer se crea una ventana con 6 pestañas en la parte superior que se corresponden con diferentes tipos de operaciones, en etapas independientes, que se pueden realizar sobre los datos:
• Preprocess: seleccion de la fuente de datos y preparación (filtrado).
• Clasify: Facilidades para aplicar esquemas de clasificación, entrenar modelos y evaluar su precisión
• Cluster: Algoritmos de agrupamiento...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Mineria de datos con weka
  • Mineria de datos empleando weka
  • Informática
  • WEKA Análisis de datos: diabetes
  • Mineria de datos
  • Mineria de Datos
  • MINERIA DE DATOS
  • Mineria de datos

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS