Es una explicación informal de la actividad que realiza una tecnología denominada minería de datos Lo que se pretende con esta tecnología es descubrir conocimiento oculto a partir de grandesvolúmenes de datos. Desde la década pasada, debido a los grandes avances computacionales, se ha ido incorporando a las organizaciones para constituirse en un apoyo esencial al momento de tomar decisiones.Organizaciones tales como empresas, clubes profesionales deportivos, universidades y gobiernos, entre otros, hacen uso de esta tecnología como ayuda en la toma de sus decisiones. Algunos de estos ejemplosserán citados en el presente trabajo Aunque desde un punto de vista académico el término data mining es una etapa dentro de un proceso mayor llamado extracción de conocimiento en bases de datos en elentorno comercial, así como en este trabajo, ambos términos se usan de manera indistinta. Lo que en verdad hace el data mining es reunir las ventajas de varias áreas como la Estadística, laInteligencia Artificial, la Computación Gráfica, las Bases de Datos y el Procesamiento Masivo, principalmente usando como materia prima las bases de datos. Una definición tradicional es la siguiente: "Unproceso no trivial de identificación válida, novedosa, potencialmente útil y entendible de patrones comprensibles que se encuentran ocultos en los datos" y su uso de data mining cada caso es un caso. Sinembargo, en términos generales, el proceso se compone de cuatro etapas principales:
1. Determinación de los objetivos. Trata de la delimitación de los objetivos que el cliente desea bajo laorientación del especialista en data mining.
2. Preprocesamiento de los datos. Se refiere a la selección, la limpieza, el enriquecimiento, la reducción y la transformación de las bases dedatos. Esta etapa consume generalmente alrededor del setenta por ciento del tiempo total de un proyecto de data mining.
3. Determinación del modelo. Se comienza realizando unos análisis...
Leer documento completo
Regístrate para leer el documento completo.