La estadisitica

Solo disponible en BuenasTareas
  • Páginas : 9 (2190 palabras )
  • Descarga(s) : 0
  • Publicado : 7 de enero de 2011
Leer documento completo
Vista previa del texto
Minería de Datos

Rosa Elena Colado Martínez,
Rafael Mendoza Zatarain, Raúl Carvajal Valdés

Escuela de Informática Mazatlán
Universidad Autónoma de Sinaloa
rcolado@mzt.megared.net.mx

[pic]

Resumen

En este artículo se presenta información sobre conceptos generales y técnicas del proceso de la minería de datos (Data Mining) dentro del desarrollo del descubrimiento delconocimiento en bases de datos (KDD), la minería de datos descubre patrones de interés en grandes volúmenes de datos que pueden estar almacenados en las bases de datos, almacenes de datos u otros repositorios de información. La minería de datos surge a partir de la evolución de la tecnología de bases de datos y la necesidad de la aplicación de esta tecnología, se da a partir del explosivo crecimiento delos datos obtenidos de las aplicaciones de negocios, ciencia y tecnología, administración de gobierno, entre otras.

Palabras clave

Minería de datos, descubrimiento del conocimiento, repositorios de información, patrones.

Introducción

Los primeros desarrollos de colección de datos y mecanismos de creación de bases de datos sirvieron como un prerrequisito para el desarrollo demecanismos para almacenamiento, recuperación, consulta y procesamiento de transacciones. La minería de datos es el resultado natural de la evolución de la tecnología de la información.

La investigación y desarrollo de los sistemas de bases de datos en los 70’s y 80’s evolucionó desde los sistemas de bases de datos jerárquicos y de red, al desarrollo de sistemas de bases de datos relacionales,herramientas de modelado de datos y técnicas de organización e indexación de datos. Los usuarios ganaron un acceso conveniente y flexible a los datos a través de lenguajes de consultas, uso de interfaces, optimización de consultas y manejo de transacciones.

La tecnología de las bases de datos desde mediados de los 80´s ha estado caracterizada por la aceptación de la tecnología relacional y elresurgimiento de las actividades de investigación para el desarrollo de nuevos y poderosos sistemas de BD.

El empleo avanzado de estos modelos como el relacional-extendido, orientado a objetos, objeto relacional y modelos deductivos.

Sistemas de bases de datos heterogéneas, sistemas de información global basados en internet tales como www han aparecido también y jugado un papel muy importante enla industria de la información. El firme progreso de la tecnología del hardware de computadoras en las últimas tres décadas ha permitido un gran acceso a poderosas computadoras debido al abaratamiento de los sistemas de almacenamiento, el incremento de las velocidades de los procesadores, transmisión de datos veloces y confiables.

La tecnología ha dado un gran impulso a la industria de lainformación y bases de datos haciendo disponibles un gran número de repositorios de información y BD para manejo de transacciones, recuperación de la información y análisis de datos. Los datos pueden ser almacenados en diferentes tipos de bases de datos.

Almacenes de datos (Data Warehouse) es una arquitectura que surgió a fines de los 80´s, la cual es un repositorio de múltiples fuentes dedatos heterogéneas organizado bajo un esquema unificado para facilitar la toma de decisiones. Esta arquitectura incluye limpieza e integración de datos y proceso analítico en línea (OLAP).

La minería de datos, al igual que los almacenes de datos, apareció también a fines de los 80´s y trata la extracción o minado de conocimiento de grandes cantidades de datos.

Es común que se refieran altérmino de minería de datos como un sinónimo de Descubrimiento del Conocimiento en Base de Datos (KDD); sin embargo, la minería de datos solo es una fase del proceso del KDD, siendo éste:

• Limpieza e integración de datos
• Selección y transformación de datos
• Minado de datos
• Evaluación de patrones
• Presentación del conocimiento.
[pic]

Figura 1. Proceso para el...
tracking img