Agrupamientos

Solo disponible en BuenasTareas
  • Páginas : 8 (1858 palabras )
  • Descarga(s) : 0
  • Publicado : 22 de noviembre de 2010
Leer documento completo
Vista previa del texto
AGRUPAMIENTOS

INTRODUCCIÓN

Para el manejo de grandes volúmenes de información es indispensable contar con herramientas que apoyen su clasificación y faciliten el análisis de la misma.

La minería de datos es un campo dentro de la Inteligencia Artificial, que se ha desarrollado para extraer información y conocimiento de las bases de datos, a través de la identificación de patrones.Dentro de la minería de datos, se encuentran algunos algoritmos y métodos propuestos para el análisis de la información, que permiten determinar características de los datos y están enfocados al análisis de agrupamientos.

La clasificación de muestras es un tipo de problema perteneciente a la familia de problemas asociados a encontrar agrupamientos entre objetos de cualquier tipo. Si bien laclasificación de muestras tiene características particulares que surgen de las propiedades de las muestras como objetos a agrupar, los principios generales coinciden con los que se aplican para clasificar cualquier otro tipo de elementos

AGRUPAMIENTOS

El objetivo del agrupamiento (clustering) es clasificar un grupo de datos con características similares.

Un agrupamiento es un método parasegmentar grandes conjuntos de datos, dentro de pequeños subconjuntos para facilitar su análisis, esto permite descubrir y describir las características e identificar sus patrones.

El agrupamiento es un método para segmentar grandes conjuntos de datos heterogéneos, dentro de pequeños subconjuntos homogéneos que pueden ser fácilmente manejados, analizados y modelados por separado. Por lo tanto es unade las técnicas más útiles en el proceso de minería de datos para descubrir grupos e identificar patrones interesantes en los datos analizados de la muestra.

Dentro del tema de agrupamiento, la base es la partición de objetos, para ello se busca que el agrupamiento sea optimo acorde a la muestra. Para lograr obtener un agrupamiento óptimo con k grupos en una muestra de m objetos por ncaracterísticas se siguen los siguientes pasos del proceso de agrupamiento:

Selección de Características: Las características deben seleccionarse de manera apropiada para codificar tanta información útil para nuestros objetivos como sea posible.

Elección de la Medida de Proximidad: Son medidas que cuantifican los parecidos o diferencias entre dos vectores.

Elección del Criterio de Agrupamiento:Depende del tipo de grupos que se espera que subyazcan en el conjunto de datos.

Elección del Algoritmo de Agrupamiento: Permite desenmarañar la estructura de grupos que subyace en el conjunto de datos del que dispone.

Validación de Resultados: Una vez que los resultados del algoritmo de agrupamiento se han obtenido, estos se han de verificar.

Interpretación de Resultados: Un experto en elcampo en el cual se desarrolla la aplicación debe interpretar los resultados del agrupamiento alcanzado para extraer conocimiento acerca del problema.

Las etapas que forman el proceso de agrupamiento se muestran en la figura 1

Figura 1 Esquema del Proceso de Agrupamiento (4)

TIPOS DE AGRUPAMIENTOS

Los algoritmos de agrupamiento se dividen en varias categorías según el procedimientoque utilizan para agrupar los objetos:

• Partición, algoritmos de reubicación, agrupamientos probabilísticos, métodos k-medoides y métodos k-medias; en general producen estructuras planas.

• Jerárquicos, se clasifican en aglomerados y divisibles

• Algoritmos basados en Densidad, entre ellos los algoritmos de agrupamiento por conectividad basados en densidad y los agrupamientos basados enfunciones de densidad.

• Algoritmos basados en rejillas.

• Algoritmos basados en co-ocurrencias de datos categóricos.

• Algoritmos mixtos.

Algoritmos de Partición

Dentro de los algoritmos de Partición se encuentran K-Means, K-Means Difuso, Isodata

K-Means

Este algoritmo esta basado en la minimización de la distancia interna entre objetos con respecto aun centroide (1)....
tracking img