La minería de datos

Solo disponible en BuenasTareas
  • Páginas : 16 (3842 palabras )
  • Descarga(s) : 0
  • Publicado : 6 de marzo de 2011
Leer documento completo
Vista previa del texto
La minería de datos (DM, Data Mining) consiste en la extracción no trivial de información que reside de manera implícita en los datos. Dicha información era previamente desconocida y podrá resultar útil para algún proceso. En otras palabras, la minería de datos prepara, sondea y explora los datos para sacar la información oculta en ellos.

Bajo el nombre de minería de datos se engloba todo unconjunto de técnicas encaminadas a la extracción de conocimiento procesable, implícito en las bases de datos. Está fuertemente ligado con la supervisión de procesos industriales ya que resulta muy útil para aprovechar los datos almacenados en las bases de datos.

Las bases de la minería de datos se encuentran en la inteligencia artificial y en el análisis estadístico. Mediante los modelosextraídos utilizando técnicas de minería de datos se aborda la solución a problemas de predicción, clasificación y segmentación.
Contenido
[ocultar]

* 1 Proceso
* 2 Protocolo de un proyecto de minería de datos
* 3 Técnicas de minería de datos
* 4 Ejemplos de uso de la minería de datos
o 4.1 Negocios
+ 4.1.1 Hábitos de compra en supermercados+ 4.1.2 Patrones de fuga
+ 4.1.3 Fraudes
+ 4.1.4 Recursos humanos
o 4.2 Comportamiento en Internet
o 4.3 Terrorismo
o 4.4 Juegos
o 4.5 Ciencia e Ingeniería
+ 4.5.1 Genética
+ 4.5.2 Ingeniería eléctrica
+ 4.5.3 Análisis de gases
* 5 Minería de datos y otrasdisciplinas análogas
o 5.1 De la estadística
o 5.2 De la informática
* 6 Minería de datos basada en teoría de la información
* 7 Tendencias
* 8 Herramientas de software
* 9 Referencias
* 10 Véase también
* 11 Enlaces externos

Proceso

Un proceso típico de minería de datos consta de los siguientes pasos generales:

1. Selección delconjunto de datos, tanto en lo que se refiere a las variables objetivo (aquellas que se quiere predecir, calcular o inferir), como a las variables independientes (las que sirven para hacer el cálculo o proceso), como posiblemente al muestreo de los registros disponibles.
2. Análisis de las propiedades de los datos, en especial los histogramas, diagramas de dispersión, presencia de valoresatípicos y ausencia de datos (valores nulos).
3. Transformación del conjunto de datos de entrada, se realizará de diversas formas en función del análisis previo, con el objetivo de prepararlo para aplicar la técnica de minería de datos que mejor se adapte a los datos y al problema, a este paso también se le conoce como preprocesamiento de los datos.
4. Seleccionar y aplicar la técnica de mineríade datos, se construye el modelo predictivo, de clasificación o segmentación.
5. Extracción de conocimiento, mediante una técnica de minería de datos, se obtiene un modelo de conocimiento, que representa patrones de comportamiento observados en los valores de las variables del problema o relaciones de asociación entre dichas variables. También pueden usarse varias técnicas a la vez paragenerar distintos modelos, aunque generalmente cada técnica obliga a un preprocesado diferente de los datos.
6. Interpretación y evaluación de datos, una vez obtenido el modelo, se debe proceder a su validación comprobando que las conclusiones que arroja son válidas y suficientemente satisfactorias. En el caso de haber obtenido varios modelos mediante el uso de distintas técnicas, se debencomparar los modelos en busca de aquel que se ajuste mejor al problema. Si ninguno de los modelos alcanza los resultados esperados, debe alterarse alguno de los pasos anteriores para generar nuevos modelos.

Si el modelo final no superara esta evaluación el proceso se podría repetir desde el principio o, si el experto lo considera oportuno, a partir de cualquiera de los pasos anteriores. Esta...
tracking img