Mineria de datos

Solo disponible en BuenasTareas
  • Páginas : 23 (5727 palabras )
  • Descarga(s) : 0
  • Publicado : 12 de diciembre de 2011
Leer documento completo
Vista previa del texto
Inteligencia Artificial


Tema: Minería de Datos

Introducción

Mientras que en la actualidad el volumen de datos crece de forma alarmante el número de personas que los entiende está disminuyendo de forma igualmente considerable. No obstante bajo este mar de datos está escondida información muy útil que rara vez es aprovechada dada la complejidad para obtenerla. Para solucionar esteproblema surge la minería de datos la cual extrae información relevante de los textos y la clasifica de manera que se permita estructurar la información para que luego sea organizada y permita su fácil y rápido acceso.



Desarrollo
Proceso de Descubrimiento de Conocimiento en grandes volúmenes de datos (KDD: Knowledge Discovery in Database)

Características generales.
KDD es consideradocomo el proceso no trivial de la extracción de datos ocultos, previamente desconocidos y potencialmente útiles, el cual brinda la posibilidad de ayudarnos a entender como realmente se debería hacer el descubrimiento y como apoyar de esta forma al analista, que es una persona humana después de todo, sin ellos el proceso de descubrir nuevos conocimientos simplemente no existiría.
Entre suscaracterísticas más generales se encuentran:
• Procesar automáticamente grandes cantidades de datos crudos.
• Identificar los patrones más significativos y relevantes.
• Presentarlos como conocimiento apropiado para satisfacer las metas del usuario.
Principales fases del KDD.
• Recogida de datos (Se obtiene la información que se quiere investigar sobre un cierto dominio de la organización).
•Selección, limpieza y transformación de datos (Se deben eliminar el mayor número posible de datos erróneos o inconsistentes e irrelevantes).
• Minería de datos.
• Evaluación y validación.
• Interpretación y difusión.
• Actualización y monitorización.
• Tipología de técnicas de minería de datos.

Minería de datos
La minería de datos puede definir como la extracción no trivial deinformación implícita, previamente desconocida y potencialmente útil a partir de los datos de cualquier sistema. Esta comprende de una serie de técnicas, algoritmos y métodos que limitan la cualidad humana del aprendizaje; es capaz de extraer nuevos conocimientos a partir de experiencias previas. Es una técnica de descubrimiento de conocimiento que, a su vez, hace uso de diferentes tecnologías paraconseguirlo: agrupamiento automático, predicción, clasificación, asociación de atributos, detección de patrones secuenciales, etc. Tiene por objeto extraer información y conocimiento útil de estos ficheros históricos de logs.
El proceso de minería de datos (MD) es entendido como el descubrimiento de patrones en los datos. En general debe ser un proceso automático o semi- automático. Los patronesdescubiertos deben de tener alguna utilidad o se les puede aprovechar de alguna forma. Los datos están presentes en cantidades substanciales (muy grandes).
La MD es un tema pragmático que involucra el proceso de aprendizaje de forma práctica no teórica. Se esta interesado en las técnicas para encontrar y describir patrones estructurales en los datos como una herramienta para ayudar a explicar losdatos y de esa forma lograr realizar predicciones de ellos.
La minería de datos es a menudo vista como una parte del Descubrimiento de conocimiento en las bases de datos (KDD knowlegde discovery in databases). Los procesos del KDD ocurren en varias etapas: elegir los datos apropiados, preprocesarlos, transformarlos si es necesario, realizar la minería de datos, encontrar patrones y relaciones yluego interpretar las estructuras descubiertas. Técnicas de minería de datos.
Entre las principales características y objetivos de la Minería de Datos se encuentran que:
Esta explora la información que se encuentran en las profundidades de las bases de datos. Produce cinco tipos de información: asociaciones, secuencias, clasificaciones, agrupamientos y pronósticos. Consolida esta información en...
tracking img