Técnicas y funcionalidades de data mining

Solo disponible en BuenasTareas
  • Páginas : 10 (2487 palabras )
  • Descarga(s) : 0
  • Publicado : 8 de marzo de 2011
Leer documento completo
Vista previa del texto
TALLER

Identificar las principales técnicas o algoritmos de minerías de datos, clasificadas por predictivas y descriptivas. Realice una breve descripción de cada uno.

[pic]

TÉCNICAS DE MINERIA DESCRIPTIVA

El objetivo de este tipo de minería, es encontrar patrones (correlaciones, tendencias, grupos, trayectorias y anomalías). Dentro de las principales técnicas descriptivas encontramos:Detección de Anomalías

La meta principal en la detección de Anomalías, es encontrar objetos que sean diferentes de los demás. Frecuentemente estos objetos son conocidos como Outlier. La detección de anomalías también es conocida como detección de desviaciones, porque objetos anómalos tienen valores de atributos con una desviación significativa respecto a los valores típicos esperados.Aunque los Outlier son frecuentemente tratados como ruido o error en muchas operaciones, tales como Clustering, para propósitos de detección de lavado de activos son una herramienta valiosa para encontrar comportamientos atípicos en las operaciones que un cliente realiza en una entidad financiera. En términos de salida, las técnicas actuales de detección de Outlier puede clasificarse en:

Técnicasbasadas en Modelos. Se basan en el campo de la estadísticas dada la premisa de conocer la distribución de los datos. Entre estas técnicas se resalta: método de incertidumbre y método de “convex hull”.

Técnicas basadas en proximidad. Esta técnica se basa fundamentalmente en el manejo de distancias entre objetos, entre mayor sea la distancia del objeto respecto a los demás, este es considerado comoun Outlier. Entre los principales métodos se encuentra: la distancia de mahalanobis.

Técnicas basadas en densidad. Esta técnica se basa en la estimación de densidad de los objetos, para ello, los objetos localizados en regiones de baja densidad y que son relativamente distantes de sus vecinos se consideran anómalos. Entre los principales métodos se encuentra: SHV (Smallest half-volume). Estátécnica de minera de datos generalmente es de aprendizaje no supervisado, ya que en la mayoría de los casos, no se conoce la clase, para ello se asigna una calificación a cada instancia que refleja el grado con el cual la instancia es anómala.

Clustering

El análisis de clúster es un proceso que divide un grupo de objetos de tal forma que los miembros de cada grupo son similares de acuerdo aalguna métrica. El agrupamiento de acuerdo a la similitud es una técnica muy poderosa, la clave para esto es trasladar alguna medida intuitiva de similitud dentro de una medida cuantitativa. Cuando el aprendizaje es no supervisado entonces el sistema tiene que descubrir sus propias clases, es decir, descubrir subconjuntos de objetos relacionados en el grupo de entrenamiento y encontrar descripcionesa cada una de los subconjuntos.

Las técnicas de clustering son utilizadas comúnmente para hacer segmentación y su gran aplicación está en estrategias de mercadeo mediante las cuales se determinan conjuntos de clientes que poseen el mismo comportamiento para hacer llegar ofertas especialmente diseñadas al perfil de dichos clientes. Las técnicas de segmentación permiten identificar claramente elcomportamiento de un grupo de casos que difiere de otros grupos o conjuntos, sin embargo algunos autores plantean que por lo general los clúster son resultados difíciles de entender. Algunas veces se puede utilizar un árbol de decisión a la salida del clúster para explicar con precisión el comportamiento o características de los casos que conforman el clúster.

Los algoritmos de clústerfuncionan con una metodología basada en la construcción inicial de un gran clúster y luego la subdivisión del mismo hasta encontrar grupos de muestras muy cercanas, otros por el contrario, parten asumiendo que cada registro es un clúster y luego empiezan a agrupar registros hasta que se consolidan clúster más grandes. Entre los diferentes tipos de clúster se tienen:

Bien Separados. Esta definición...
tracking img