Clustering

Páginas: 12 (2955 palabras) Publicado: 22 de abril de 2011
María López Bautista 100081668 Daniel Martín Domínguez 100072697 Grado en Ingeniería de Sistemas Audiovisuales

AGIM

Práctica 2. Clustering de imágenes

1. INTRODUCCIÓN
El término ‘clustering’ se refiere al conjunto de métodos de agrupamiento de elementos a partir de similitudes o características comunes. Se trata de métodos no supervisados, lo que significa que los datos a clasificar noestán etiquetados y deberemos relacionar los elementos mediante variables descriptivas. A lo largo de la práctica hemos utilizado las dos grandes categorías de técnicas de ‘clustering’ existentes: de particionamiento (k-means) y jerárquica. La primera de ellas divide los datos en campos disjuntos entre sí, es decir, sin elementos en común; mientras que la segunda divide los datos en grupositerativamente creando una jerarquía. Por último, antes de empezar con la práctica, indicar que compararemos los resultados a partir de seis clases preestablecidas: rosa, rojo, blanco, verde, azul y amarillo.

2. EXTRACCIÓN DE CARACTERÍSTICAS
Para llevar a cabo un ‘clustering’ es fundamental el paso de elegir unas características que nos interesan para clasificar nuestros elementos. Esta etapa esprimordial porque de ella dependerá que el resultado sea el esperado o no.

De esta manera representaremos cada imagen con una serie de parámetros o rasgos extraídos a partir de las características que hemos seleccionado. En este caso cada imagen será representada como un vector de dos dimensiones que serán la media de la componente de color H, matiz, de la imagen y la media de su componente decolor S, saturación. Ejercicio 1. Represente los valores de las medias de las componentes de H y S en un gráfico de dos dimensiones (H en el je de abscisas y S en el eje de ordenadas). Utilice distintos símbolos o colores para representar los valores correspondientes a las diferentes clases. A la vista del gráfico obtenido, discuta si las medias de las componentes H y S son parámetros adecuados parala agrupación de las imágenes en las clases consideradas.
Ejercicio 1 1 0.9 0.8

Media Componente A

0.7 0.6 0.5 0.4 0.3 0.2 0.1

Clase 1 Clase 2 Clase 3 Clase 4 Clase 5 Clase 6

0

0.1

0.2

0.3 0.4 0.5 Media Componente H

0.6

0.7

0.8

Las medias de las componentes H y S resultan un parámetro adecuado si buscamos una clasificación general y aceptamos una probabilidad deerror media. Como podemos observar

2

AGIM

Práctica 2. Clustering de imágenes

estas características pueden crear cierta confusión en algunas zonas, como el entorno del punto (0.2, 0.7). Si quisiésemos que la probabilidad de error fuese baja, casi inexistente, deberíamos utilizar otros parámetros relacionados con el color como puede ser su distribución (histograma), o caracterizar lacomponente H con varios valores y no sólo con su media.

3. ALGORITMO K-MEANS
El algoritmo k-means es un algoritmo particional que consiste en optimizar de forma iterativa la división a partir de una partición inicial aleatoria. Sigue los siguientes pasos: 1) Seleccionar número de cluster. En nuestro caso serán 6 clases. 2) Inicializar centroides de cada cluster aleatoriamente. 3) Determinarcentroide más cercano para cada dato. 4) Recalcular posición de centroides de cada cluster como la media de los datos pertenecientes a él. 5) Repetir los pasos 3 y 4 hasta alcanzar convergencia. La convergencia se considerará cuando ningún dato cambie de cluster pese a las iteraciones. Para ejecutar este algoritmo hemos recurrido a la función ‘kmeans’ de Matlab con diferentes tipos de distancia. Ademásle indicamos que lleve a cabo tres iteraciones. Ejercicio 2. a) Realice el agrupamiento de imágenes con el algoritmo k-means utilizando la distancia euclídea y represente los centroides resultantes en el gráfico del ejercicio 1.
[CL CN]=kmeans(caract,nclases,'distance','sqEuclidean','Replicates',3,'display','iter');
Características & Centroides 1 0.9 0.8

Media Componente A

0.7 0.6 0.5...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Clustering
  • Clustering
  • Clustering
  • K-Means Clustering
  • Clustering En Linux
  • medida del clustering
  • Segementacion de higado utilizando clustering
  • Un modelo de clustering temporal

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS