Mineria de datos

Páginas: 15 (3675 palabras) Publicado: 25 de mayo de 2010
Manual de Weka
Si se tienen datos y se quiere construir un árbol de decisión. Los datos pueden ser almacenados en una hoja de cálculo o base de datos. Sin embargo, Weka espera que estén en formato de ARFF

INTERFACES DE USUARIO (las formas de trabajar con Weka)

1. Simple CLI .- Intérprete de comandos o “consola”

2. Explorer: Interfaz gráfico principal Proporciona acceso alas distintas funcionalidades a través de menús y formularios de datos

3. Experimenter: Automatiza el proceso de ejecución de varios filtros y clasificadores con diferentes parámetros sobre un conjunto de datos y proporciona estadísticas de dicho proceso

• Permite comparar rendimientos y distribuir la carga de trabajo entre varias máquinas (experimentos grandes).

4. KnowledgeFlow:Similar al funcionamiento interno del programa, Permite crear una secuencia o “circuito” que recoge todo el experimento.

Archivos que pueden abrirse en WEKA

|ARFF |(Attribute-Relation File Format.)(Formato de Archivo de Atributo Relacion) |
|GZ |identifica los archivos comprimidos Gzip|
|CSV |Pueden generarse a partir de una hoja de cálculo |
| |una consulta a una base de datos. |
| |WEKA los convierte al formato ARFF automáticamente.|

1. Lo anterior es posible a través de utilizar Excel o Word y guardar el archivo con extensión CSV (delimitado por comas), en donde cada campo es separado por las comas (,), aparece un mensaje de precaución, pulsar OK.

2. Inmediatamente después lo único que se requiere es abrir un documento de texto (Word), y ahí cargar el archivo creado en Excel.Después es necesario agregar las siguientes etiquetas a los datos que aparecen en word.

|1 |@relation |Nombre del archivo en Excel |
|2 |@attribute |Los atributos como pueden ser (nombre, edad, domicilio) |
|3 |@data|Los datos como (enrique, 31, colon 107-b) |

1. Cabecera. Se define el nombre de la relación. Su formato es el siguiente:

@relation

Donde es de tipo String*. Si dicho nombre contiene algún espacio será necesario expresarlo entrecomillado.

2. Declaraciones de atributos. En esta sección se declaran los atributos quecompondrán nuestro archivo junto a su tipo. La sintaxis es la siguiente:

@attribute

Donde es de tipo String teniendo las mismas restricciones que el caso anterior. Weka acepta diversos tipos, estos son: numeric, integer, date, String, enumerado

3. Sección de datos. Declaramos los datos que componen la relación separando entre comas los

atributos y con saltos delínea las relaciones.

@data 4,3.2

Aunque éste es el modo “completo" es posible definir los datos de una forma abreviada (sparse data). Si tenemos una muestra en la que hay muchos datos que sean 0 podemos expresar los datos prescindiendo de los elementos que son nulos, rodeando cada una de las filas entre llaves y situando delante de cada uno de los datos el número deatributo**. Un ejemplo de esto es el siguiente

@data {1 4, 3 3}

Después de hacer lo anterior se debe guardar el documento de la siguiente manera:

1. Guardar como texto

2. Después es necesario renombrar el archivo con extensión . ARFF (Attribute-Relation

File Format.)(Formato de Archivo de Atributo Relacion).

De esta manera es posible empezar a analizar los...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Mineria de Datos
  • MINERIA DE DATOS
  • Mineria de datos
  • Mineria de datos
  • mineria de datos
  • Mineria de dato
  • Mineria de datos
  • Mineria de datos

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS