Data mining

Solo disponible en BuenasTareas
  • Páginas : 2 (472 palabras )
  • Descarga(s) : 4
  • Publicado : 13 de mayo de 2010
Leer documento completo
Vista previa del texto
MINERÍA DE DATOS O DATA MINING
La revolución digital que se ha ido dando durante los últimos años, ha posibilitado que la captura y el almacenamiento de datos tenga un coste casi nulo. En laactualidad, las organizaciones pueden disponer de una cantidad enorme de datos almacenados y de los cuales sería de gran ayuda poder sacar información útil. Para poder tratar con estas cantidades de datos,las técnicas tradicionales de estadística y las herramientas de gestión clásicas no sirven debido a que no están preparadas para trabajar con tanta información, así que se necesitan nuevasherramientas. De la necesidad de descubrir conocimiento a partir de los datos, sale el proceso de Descubrimiento de Conocimiento en Bases de Datos o KDD (Knowledge Discovery in Databases). Ese proceso puede serdefinido como el proceso no trivial de identificar patrones en los datos que sean válidos, que aporten información desconocida hasta el momento, útiles y comprensibles. El KDD consta de tres partesbien diferenciadas: 1. Preprocesamiento de los datos. 2. Minería de Datos. 3. Postprocesamiento de los resultados. En el preprocesamiento de los datos se corrigen datos erróneos o incompletos, se eliminael posible ruido que contengan los datos, etc... En el postprocesamiento, a partir de los resultados de la minería de datos, se pueden preparar patrones y sacar conclusiones de los que se puedaextraer conocimiento, que es el objetivo final del proceso de KDD. El proceso más importante es el de Minería de Datos o DM (Data Mining) . Una definición formal de la DM sería: La minería de datos es elproceso automático para el descubrimiento de información útil en grandes cantidades de datos. Este proceso es un campo multidisciplinario, en el que se pretende predecir resultados y/o descubrirrelaciones entre los diferentes datos. Las diferentes tareas que puede realizar la DM son: • Clasificación: Mediante la clasificación se busca encontrar un modelo que pueda predecir el comportamiento de...
tracking img