Minería de datos con Weca

Páginas: 7 (1685 palabras) Publicado: 11 de mayo de 2014
Trabajo Integrador Data Mining

Como objetivo del trabajo a desarrollar vamos a demostrar el poder de una herramienta llamada Weka la cual es muy útil para llevar a cabo la aplicación de la Mineria de Datos.

Weka (Waikato Environment for Knowledge Analysis - Entorno para Análisis del Conocimiento de la Universidad de Waikato) es una plataforma de software para aprendizajeautomático y minería de datos escrito en Java y desarrollado en la Universidad de Waikato. Weka es un software libre distribuido bajo licencia GNU-GPL.

El paquete Weka contiene una colección de herramientas de visualización y algoritmos para análisis de datos y modelado predictivo, unidos a una interfaz gráfica de usuario para acceder fácilmente a sus funcionalidades. La versión original de Weka fueun front-end en TCL/TK para modelar algoritmos implementados en otros lenguajes de programación, más unas utilidades para preprocesamiento de datos desarrolladas en C para hacer experimentos de aprendizaje automático. Esta versión original se diseñó inicialmente como herramienta para analizar datos procedentes del dominio de la agricultura, pero la versión más reciente basada en Java (WEKA 3), que empezó adesarrollarse en 1997, se utiliza en muchas y muy diferentes áreas, en particular con finalidades docentes y de investigación.

Caso de Estudio

En nuestro caso vamos a tomar una Base de Datos sobre Vinos, específicamente tenemos datos acerca de la cantidad de 13 constituyentes los cuales son resultado de un análisis químico de vinos obtenidos en la misma región de Italia pero que derivan de trescultivos distintos.

Vamos a trabajar con el motor de Base de Datos MySQL en el cual crearemos la BD “Wine”, quien contendrá la tabla “cultivo” con sus atributos:

1) TipoDeCultivo
2) Alcohol
3)Malic acid
4) Ash
5) Alcalinity of ash
6) Magnesium
7) Total phenols
8) Flavanoids
9) Nonflavanoid phenols
10) Proanthocyanins
11)Color intensity
12)Hue
13)OD280/OD315 of dilutedwines
14)Proline
Todos los atributos son continuos
No hay estadísticas disponibles, pero se sugiere estandarizar variables para ciertos usos (por ejemplo, para nosotros, con los clasificadores que no son invariantes en escala)

NOTA:el primer atributo es el identificador de clase (1-3)
METODOLOGÍA
Mediante el uso de métodos de minería de datos, nuestro objetivo principal es evaluar estosdatos y tratar de entender los indicadores de la clasificación de los vinos, para eso utilizaremos métodos de pre-procesamiento, clasificación y agrupamiento de minería de datos. El método de asociación no es aplicable para los valores numéricos.
Con el uso del pre-procesamiento, resumiremos los datos de la mejor manera. Con la ayuda de la eliminación de los datos discretos , trataremos devisualizar las relaciones de componente que se use en 3 diferentes tipos de vino.
Por los métodos de clasificación, nuestro objetivo principal es clasificar los datos en los árboles de decisión y hacer una predicción más cerca de la realidad. Vamos a utilizar algún criterio de los que vienen incorporados para el filtrado de árbol . Para entender los valores de la entropía y la ganancia, que vamosa usar el teorema de Bayes.
Durante la clasificación, también vamos a hacer una predicción con la ayuda de Weka.
La agrupación, nos servirá para ver los efectos de las variables en un gráfico.















Resultados de la Prueba
Hemos utilizado 178 vinos distintos de los que 59 de ellos pertenecen a la "Clase 1", 71 de ellos pertenecen a la "clase 2" y 48 de ellospertenecen a "Class3". "Class1", "Clase 2", y el "Class3".
Clasificación
Teorema de Bayes:
Utilizando el método NaiveBayes clasificación, llegamos a la P (h1) valores como el 33% para la clase 1, 40% para la Clase 2, el 27% de la Clase 3. Bayes método de clasificación nos ha dado buen porcentaje en la predicción. Probabilidades posteriores también se muestran a continuación. Valor de la...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Mineria de datos
  • Mineria de Datos
  • MINERIA DE DATOS
  • Mineria de datos
  • Mineria de dato
  • Mineria de datos
  • Mineria De Datos
  • mineria de datos

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS