Conceptos de mineria de datos

Solo disponible en BuenasTareas
  • Páginas : 3 (544 palabras )
  • Descarga(s) : 0
  • Publicado : 10 de mayo de 2011
Leer documento completo
Vista previa del texto
CONCEPTOS DE MINERIA DE DATOS
La minería de datos es el proceso que sirve para detectar la información procesable en bases de datos muy grandes. Este proceso utiliza un análisis matemático paradeducir patrones y tendencias que existen entre los mismos datos.

La minería de datos se puede utilizar para situaciones empresariales como son:
* Predecir Ventas
* Dirigir correos a clientesespecíficos
* Determinar que tipo de productos se pueden vender juntos
Entre otros, la generación de un modelo de minería de datos se puede definir mediante seis pasos como son:
1. Definir elproblema
2. Preparar los datos
3. Explorar los datos
4. Generar Modelos
5. Explorar y validar los modelos
6. Implementar y actualizar los modelos

Definir Problema
Este es elprimer paso de la minería de datos y consiste en definir claramente el problema.

Preparar los datos
Es el segundo paso de la minería de datos y consiste en limpiar los datos, los datos pueden estardispersos en la empresa y en distinto formato, también pueden tener incoherencias y errores . La limpieza de los datos , no solo implica quitar los datos que no son relevantes, sino también ver lacorrelaciones que existen entre ellos. Cabe mencionar que los datos que se utilizan para la minería de datos no necesita ser almacenado en un cubo de procesamiento analítico (OLAP), ni siquiera en unabase de datos relacional, se puede realizar la minería de datos mediante cualquier origen de datos como pueden ser archivos de texto, Excel etc.

Explorar los datos
Es el tercer paso de la mineríade datos y aquí se debe de conocer bien los datos para llegar a una toma de decisión adecuada, al explorar los datos para conocer el problema empresarial, se puede decidir si el conjunto de datosseleccionados son defectuosos y a continuación se toma una estrategia para corregir los problemas.

Generar Modelos
Es el cuarto paso de la minería de datos y aquí es donde se genera un modelo o...
tracking img