Weka

Páginas: 16 (3774 palabras) Publicado: 19 de febrero de 2013
Aplicación de algoritmos de clasificación supervisada usando Weka.

Abstract

Este trabajo está enmarcado en el tema de minería de datos y tiene como finalidad descubrir el nivel de confianza de los algoritmos de clasificación.
Esto se realizará mediante corridas de los algoritmos supervisados de clasificación mostrando el nivel de bondad que tiene los modelos generados. Elinterrogante que este trabajo pretende develar es si este nivel de confianza aumenta o disminuye al disponer de mayor cantidad de datos de entrenamiento.
Para efectuar las corridas de dichos algoritmos
utilizaremos el software Weka una herramienta libre para el aprendizaje automático de la información.

Palabras Clave
Minería de datos, Weka, Software Libre, algoritmos de clasificación.Introducción

[1] La minería de datos consiste en la extracción no trivial de información que reside de manera implícita en los datos. Dicha información era previamente desconocida y podrá resultar útil para algún proceso. En resumen, la minería de datos prepara, sondea y explora los datos para sacar la información oculta en ellos.

Minería de datos abarca todo un conjunto de técnicas enfocadas en laextracción de conocimiento implícito en las bases de datos. Las bases de la minería de datos se encuentran en la inteligencia artificial y en el análisis estadístico. Mediante los modelos extraídos utilizando técnicas de minería de datos se aborda la solución a problemas de predicción, clasificación y segmentación.

Un proceso típico de minería de datos consta de los siguientespasos generales:

Selección del conjunto de datos: tanto en lo que se refiere a las variables dependientes, como a las variables objetivo, como posiblemente al muestreo de los registros disponibles.
Análisis de las propiedades de los datos: en especial los histogramas, diagramas de dispersión, presencia de valores atípicos y ausencia de datos (valores nulos). Transformación delconjunto de datos de entrada: en esta etapa se realizará un conjunto de operaciones con la finalidad de preparar los datos de análisis, con el objetivo de adaptarlos para aplicar la técnica de minería de datos que mejor se adapte al problema.
Seleccionar y aplicar la técnica de minería de datos: La elección de la técnica dependerá de la naturaleza del problema a resolver. Parapoder implementar la técnica seleccionada, se debe proceder a elegir algún software que facilite el trabajo de aprendizaje automático.
Evaluar los resultados: contrastándolos con un conjunto de datos (datos de entrenamiento) previamente reservados para validar la generalidad del modelo. A continuación se muestra en la Figura 1, como es la proporción de carga de trabajo en cadauna de las etapas.

Figura 1. Tiempo estimado en el proceso de minería de datos.

Si el modelo obtenido no superara esta evaluación el proceso se podría repetir desde el principio o, si se considera oportuno, a partir de cualquiera de los pasos anteriores.

Como ya se ha comentado, las técnicas de la minería de datos provienen de la Inteligencia artificial y de laestadística, dichas técnicas, no son más que algoritmos, más o menos sofisticados que se aplican

sobre un conjunto de datos para obtener resultados. En la fase de minería de datos, se decide cuál es la tarea a realizar (clasificar, agrupar etc.) y se elige la técnica descriptiva o predictiva que se va a utilizar.

A continuación se muestra en un gráfico con las principales técnicas deminería de datos:

Figura 2. Técnicas de minería de datos.

A continuación se detallan algunas de las técnicas más usadas.

Redes neuronales: Se trata de un sistema de interconexión de neuronas en una red que colabora para producir un estímulo de salida. Algunos ejemplos de red neuronal son: El Perceptrón, El Perceptrón multicapa. Los Mapas Autoorganizados, también conocidos...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Weka
  • WEKA
  • weka
  • Weka
  • Weka
  • Problema Weka
  • INFORME WEKA
  • WEKA NET_BEANS

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS