Postgrado mineria de datos

Solo disponible en BuenasTareas
  • Páginas : 5 (1080 palabras )
  • Descarga(s) : 0
  • Publicado : 11 de septiembre de 2012
Leer documento completo
Vista previa del texto
Introducción

En el trabajo se analizará uno de los ejemplos que trae la liberaría de la herramienta Weka. Con el apoyo de dicha herramienta y siguiendo los pasos indicados por la metodología CRISP-DM se analizaran e interpretaran los datos del caso de estudio Contact-Lenses.
Para su solución es necesario cumplir los siguientes objetivos:
• Integración y recopilación de los datos.
•Selección, limpieza y transformación de los datos.
• Modelo de construcción para la minería de datos.
• Medición e interpretación de los resultados obtenidos.
• Toma de decisiones de acuerdo a los conocimientos adquiridos.




Desarrollo

1. Que es la minería de datos
La minería de datos se define, como el descubrimiento de patrones, asociaciones, cambios, anomalías, reglas y eventos a partirde los datos. Es decir, la extracción de conocimiento, en forma de modelos o patrones, de los datos.

2. Sobre la herramienta WEKA
WEKA, acrónimo de Waikato Environment for Knowledge Analysis, es un entorno para experimentación de análisis de datos que permite aplicar, analizar y evaluar las técnicas más relevantes de análisis de datos. Está constituido por una serie de paquetes de códigoabierto con diferentes técnicas de preprocesado, clasificación, agrupamiento, asociación, y visualización, así como facilidades para su aplicación y análisis de prestaciones cuando son aplicadas a los datos de entrada seleccionados.

3. Metodología CRISP-DM
Acrónico de CRoss-Industry Standard Process for Data Mining (Proceso de Construcción Cruzada Estándar de Minería de Datos). Trata elproceso de forma global y toma en cuenta los aspectos empresariales o de negocio de este. Cuenta de tres fases las cuales guiaran el desarrollo del trabajo.

4. Caso de Estudio

Comprensión del negocio
Según el ejemplo tomado de la herramienta WEKA se desea a través un determinado número de parámetros con sus respectivos valores cual es la tendencia de esos datos para determinar que tipo depersonas deben o no usar lentes de contacto.

Comprensión de los datos
Problema: determinar el tipo de lentes de contacto (fuerte, suave, ninguna) que debe usar una persona según la evaluación de los para parámetros que se muestran a continuación:

Descripción de instancias: 4 atributos nominales
1. Edad (joven, antecedente vista cansada, vista cansada)
2. Problema (miope, hipermiope)
3.Astigmatismo (si, no)
4. lagrimas(reducido, normal)
#de instancias: 24

Fichero contact-lenses.arrf
@relation contact-lenses

@attribute age {young, pre-presbyopic, presbyopic}
@attribute spectacle-prescrip {myope, hypermetrope}
@attribute astigmatism {no, yes}
@attribute tear-prod-rate {reduced, normal}
@attribute contact-lenses {soft, hard, none}

@data
%
% 24 instances
%young,myope,no,reduced,none
young,myope,no,normal,soft
young,myope,yes,reduced,none
young,myope,yes,normal,hard
young,hypermetrope,no,reduced,none
young,hypermetrope,no,normal,soft
young,hypermetrope,yes,reduced,none
young,hypermetrope,yes,normal,hard
pre-presbyopic,myope,no,reduced,none
pre-presbyopic,myope,no,normal,soft
pre-presbyopic,myope,yes,reduced,nonepre-presbyopic,myope,yes,normal,hard
pre-presbyopic,hypermetrope,no,reduced,none
pre-presbyopic,hypermetrope,no,normal,soft
pre-presbyopic,hypermetrope,yes,reduced,none
pre-presbyopic,hypermetrope,yes,normal,none
presbyopic,myope,no,reduced,none
presbyopic,myope,no,normal,none
presbyopic,myope,yes,reduced,none
presbyopic,myope,yes,normal,hard
presbyopic,hypermetrope,no,reduced,nonepresbyopic,hypermetrope,no,normal,soft
presbyopic,hypermetrope,yes,reduced,none
presbyopic,hypermetrope,yes,normal,none


Preparación de los datos

Este fichero fue seleccionado de un conjunto de ejemplos que trae consigo la herramienta, por lo que los datos para esta fase ya se encuentran preparados para su procesamiento y no fue necesario hacer ningún cambio en los atributos

Modelado

Dentro del modelo descriptivo...
tracking img