Mineria

Páginas: 6 (1333 palabras) Publicado: 2 de octubre de 2012
Gesti´n y Tecnolog´
o
ıa
del Conocimiento
Miner´ de Datos
ıa
Agosto - Septiembre 2008

Ejercicios de Weka
Comentarios generales sobre los ejercicios
• Asumiendo que se conocen los contenidos te´ricos, el tiempo estimado
o
para realizar los ejercicios es de 2 horas
• Describir las soluciones a los ejercicios de una manera lo m´s formal
a
posible

1.

An´lisis de los datos
aEl objetivo de este ejercicio es familiarizarse con el entorno de Weka, y estudiar algunas de las funcionalidades
de an´lisis de datos. Estas funcionalidades incluyen an´lisis estad´
a
a
ıstico, visualizaci´n, etc. Recordad que el manual
o
de Weka est´ disponible en http://www.cs.waikato.ac.nz/ml/weka/index documentation.html
a

1.1.

Obtenci´n de los datos
o

Descargar el siguienteconjunto de datos:
iris data set: iris.arff
Abrir el fichero de datos con un editor, y estudiar su contenido:
1. ¿Cu´ntos atributos caracterizan los datos de esta tabla de datos?
a
2. Si suponemos que queremos predecir el ultimo atributo a partir de los anteriores, ¿estar´
´
ıamos ante un problema
de clasificaci´n o de regresi´n?
o
o

1.2.

Estudio estad´
ıstico de los datos
Lanzar laherramienta weka
Lanzar el Explorer
Abrir el fichero iris.arff

Una vez cargado el conjunto de datos, en la secci´n attributes se puede pinchar sobre cada atributo para obtener
o
informaci´n estad´
o
ıstica de ellos. Contestad a las siguientes preguntas:
1. ¿Cu´l es el rango de valores del atributo petalwitdth?
a
2. Con la informaci´n que puedes obtener visualmente, ¿qu´ atributo/s creesque son los que mejor permitir´n
o
e
a
predecir el atributo class?

1.3.

Aplicaci´n de filtros
o

1. Aplicar el filtro filters/unsupervised/attribute/normalize sobre el conjunto de datos. ¿Qu´ efecto tiene este
e
filtro?
2. Aplicar el filtro filters/unsupervised/instance/RemovePercentage sobre el conjunto de datos. ¿Qu´ efecto tiene
e
este filtro?
3. Grabar el conjunto de datos comoiris2.arff.
4. Aplicar el filtro filters/unsupervised/attribute/Discretize sobre el conjunto de datos. ¿Qu´ efecto tiene este
e
filtro?

1.4.

Visualizaci´n
o

Volver a cargar el conjunto de datos iris2.arff Pulsar la pesta˜a Visualize. Aumentar Point Size a 5 para
n
visualizarlos datos mejor.
1. Aumentar el valor de Jitter: ¿qu´ efecto tiene?
e

2.

Clasificaci´n
o

El objetivo deeste ejercicio es familiarizarse con las primeras t´cnicas de an´lisis de datos. En concreto, con los
e
a
a
´rboles de decisi´n.
o

2.1.

Clasificador ZeroR

Cargar el conjunto de datos iris.arff. En la pesta˜a Classify, seleccionar el clasificador ZeroR. En las Test
n
Options seleccionar Use trainning set, y pulsar el bot´n de Start para que genere el clasificador. En un instante, en
ola ventana de salida aparecer´n los datos de la clasificaci´n realizada. Analizar esta salida.
a
o
1. ¿Qu´ modelo genera el clasificador ZeroR?
e
2. ¿Cu´ntas instancias del conjunto de entrenamiento clasifica bien?
a
3. ¿Qu´ porcentaje de instancias clasifica bien?
e
4. ¿Qu´ crees que indica la matriz de confusi´n?
e
o

2.2.

Clasificador J48

Cargar el conjunto de datos iris.arff. Enla pesta˜a Classify, seleccionar el clasificador trees/j48. En las Test
n
Options seleccionar Use trainning set, y pulsar el bot´n de Start para que genere el clasificador.
o
1. ¿Cu´ntas hojas tiene el ´rbol generado con J48?
a
a
2. ¿Cu´ntas instancias del conjunto de entrenamiento clasifica bien?
a
3. ¿Qu´ porcentaje de instancias clasifica bien?
e
4. Analizar la matriz de confusi´n: ¿qu´ha clasificado mal?
o
e
5. Pulsar el bot´n de More Options y seleccionar la opci´n de Output predictions. ¿En qu´ instancias se ha
o
o
e
equivocado?
6. Elegir una instancia que J48 haya clasificado err´neamente y a analizar por qu´
o
e
Adem´s, utiliza alguna de las herramientas de visualizaci´n de Weka:
a
o
En la ventana de Result list, pulsa en el bot´n derecho sobre el modelo...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Mineria
  • Mineria
  • Mineria
  • Mineria
  • Mineria
  • Mineria
  • Mineria
  • MINERIA

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS