Kdd: knowledge discovery from databases

Solo disponible en BuenasTareas
  • Páginas : 16 (3980 palabras )
  • Descarga(s) : 4
  • Publicado : 1 de junio de 2010
Leer documento completo
Vista previa del texto
Knowledge
Discovery in
Databases

The discovery of buying patterns is a very important knowledge source for the development of selling and buying strategies in a company. Obtaining these patterns in a quick and easy way enables us to know and analiyse the needs of our clients, and learn what we can do to solve these needs. In order to extract these patterns we use theprocess of knowledge discovery in databases (KDD). This process consists of several steps that lead us to discover interesting patterns in our data. This paper describes the concept of knowledge discovery in databases.

Introducción

En los últimos años, ha existido un gran crecimiento en nuestras capacidades de generar y colectar datos, debido básicamente al gran poder de procesamiento de lasmáquinas como a su bajo costo de almacenamiento.

Sin embargo, dentro de estas enormes masas de datos existe una gran cantidad de información oculta, de gran importancia estratégica, a la que no se puede acceder por las técnicas clásicas de recuperación de la información. El descubrimiento de esta información oculta es posible gracias a la Minería de Datos (Data Mining), que entre otras sofisticadastécnicas aplica la inteligencia artificial para encontrar patrones y relaciones dentro de los datos permitiendo la creación de modelos, es decir, representaciones abstractas de la realidad, pero es el descubrimiento del conocimiento (KDD, por sus siglas en inglés) que se encarga de la preparación de los datos y la interpretación de los resultados obtenidos, los cuales dan un significado a estospatrones encontrados.

Así el valor real de los datos reside en la información que se puede extraer de ellos, información que ayude a tomar decisiones o mejorar nuestra comprensión de los fenómenos que nos rodean. Hoy, más que nunca, los métodos analíticos avanzados son el arma secreta de muchos negocios exitosos. Empleando métodos analíticos avanzados para la explotación de datos, los negociosincrementan sus ganancias, maximizan la eficiencia operativa, reducen costos y mejoran la satisfacción del cliente.

1.
KDD
En una empresa los sistemas de información han sufrido un gran aumento debido a la capacidad del proceso, más económico y versátil. Sin embargo, esta gran cantidad de información generalmente no tiene ningún orden específico y para solucionar este problema se utilizara elproceso de Descubrimiento de Conocimiento en Base de Datos o KDD (del inglés Knowledge Discovery from Databases), según fallad es una disciplina cuya finalidad es “la extracción no trivial desde un conjunto de datos de información implícita, desconocida y potencialmente útil”. El KDD propone que los datos provenientes de distintas fuentes son normalizados y combinados en una Base de Datos sobre lacual se aplican técnicas de Minería de Datos (MD).
Dentro de los elementos que incluye el KDD se destaca el determinar y analizar las necesidades de la organización y la definición del problema. Hay una distinción clara entre el proceso de extracción de datos y el descubrimiento del conocimiento. Esta disciplina se diferencia claramente con los métodos estadísticos, ya que, la estadística seutiliza para validar o parametrizar un modelo sugerido y preexistente, no para generarlo. A la vez es diferenciado del “Análisis Inteligente de Datos” (IDA, del inglés Intelligent Data Analysis), que corresponde al uso de técnicas de inteligencia artificial en el análisis de los datos. KDD al no compararse directamente con los métodos anteriores, si logra relacionarse y nutrirse, naciendo comointerfaz de diferentes disciplinas: como la estadística, sistemas de información (bases de datos), aprendizaje automático (IA), visualización de datos, computación paralela (distribuida), interfaces de lenguaje natural a bases de datos.
KDD puede usarse como un medio de recuperación de información, de la misma manera que los agentes inteligentes realizan la recuperación de información en el Web....
tracking img