Data Mining, Mineria De Datos
FACULTAD DE CIENCIAS ADMINISTRATIVAS
SISTEMAS DE INFORMACIÓN GERENCIAL
DATA MINING
PROFESORA MIGDALIA TESTA
OBED BARRERA
CARLOS CANO
LUZ PALACIOS
KATHRYN VIERA
MIERCOLES 21 DE MARZO DE 2012
Introducción
El objetivo principal de este trabajo es una explicación informal de la actividad que realiza una tecnología denominada Data Mining(minería de datos). Lo que se pretende con esta tecnología es descubrir conocimiento oculto a partir de grandes volúmenes de datos. Desde la década pasada, debido a los grandes avances computacionales, se ha ido incorporando a las organizaciones para constituirse en un apoyo esencial al momento de tomar decisiones. Organizaciones tales como empresas, clubes profesionales deportivos, universidades ygobiernos, entre otros, hacen uso de esta tecnología como ayuda en la toma de sus decisiones.
El desarrollo del contenido ha sido dividido en cuatro capítulos principales:
* ¿Qué es el Data Mining? (Donde abordaremos lo que refiere a conceptos e historia del Data Mining.)
* Fundamentos y estructuras del Data Mining, (en esta parte daremos a entender las principales características,los beneficios y estructuras de la minería de datos.)
* Etapas y técnicas de un proyecto de Data Mining, (se explicaran los procesos a realizarse en un proyecto de Data Mining incluyendo las técnicas utilizadas para estos procesos, todo esto enfocado en el área empresarial que es donde más se utiliza).
* Por último Aplicaciones del Data Mining, (donde mostraremos la gran y diversautilidad de la minería de datos que como ya hemos mencionado esta presente en muchas áreas tales como empresariales, de gobierno, deportes, universidad, etc)
Definición
El datamining (minería de datos), es el conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos, de manera automática o semiautomática, con el objetivo de encontrar patrones repetitivos, tendencias o reglasque expliquen el comportamiento de los datos en un determinado contexto.
Básicamente, el datamining surge para intentar ayudar a comprender el contenido de un repositorio de datos. Con este fin, hace uso de prácticas estadísticas y, en algunos casos, de algoritmos de búsqueda próximos a la Inteligencia Artificial y a las redes neuronales.
De forma general, los datos son la materia primabruta. En el momento que el usuario les atribuye algún significado especial pasan a convertirse en información. Cuando los especialistas elaboran o encuentran un modelo, haciendo que la interpretación que surge entre la información y ese modelo represente un valor agregado, entonces nos referimos al conocimiento.
A grandes rasgos la minería de datos busca encontrar datos implícitos en conjuntos(estructurados o no-estructurados) de información, como puede ser una base de datos, que puedan servir para comprender mejor el comportamiento de los flujos de información.
Proceso
Un proceso típico de minería de datos consta de los siguientes pasos generales:
Selección del conjunto de datos, tanto en lo que se refiere a las variables objetivo (aquellas que se quiere predecir, calcularo inferir), como a las variables independientes (las que sirven para hacer el cálculo o proceso), como posiblemente al muestreo de los registros disponibles.
Análisis de las propiedades de los datos, en especial los histogramas, diagramas de dispersión, presencia de valores atípicos y ausencia de datos (valores nulos).
Transformación del conjunto de datos de entrada, se realizará dediversas formas en función del análisis previo, con el objetivo de prepararlo para aplicar la técnica de minería de datos que mejor se adapte a los datos y al problema, a este paso también se le conoce como preprocesamiento de los datos.
Seleccionar y aplicar la técnica de minería de datos, se construye el modelo predictivo, de clasificación o segmentación.
Extracción de conocimiento, mediante...
Regístrate para leer el documento completo.