Mejor

Páginas: 8 (1855 palabras) Publicado: 4 de octubre de 2011
Análisis de Cúmulos (cluster).

El análisis de cúmulos, también llamado segmentación o análisis taxonómico es una forma de hacer una partición de un conjunto de objetos, en cúmulos, de tal suerte de que los objetos en el mismo cúmulo comparte un perfil mientras los objetos en otro cúmulo tiene un perfil totalmente diferente.

El análisis de cúmulos puede llevarse a cabo en cualquier base dedatos. Los sujetos en la base de datos deben tener propiedades que puedan ser valoradas de forma numérica.

Procedimiento para encontrar los cúmulos.

1.- Encontrar la similitud o disimilitud entre cada par de objetos en la base de datos. En este paso, usted debe calcular las distancias entre objetos usando una función de distancia. La métrica más utilizada en la euclidiana la cual mide ladistancia entre dos puntos en el espacio utilizando la siguiente ecuación

d2 = (x1 – x2)2 + (y1 – y2)2 + … + (z1 – z2)2

2.- Agrupe los objetos en un árbol binario de jerarquía de cúmulos. En este paso, usted debe agrupar, los objetos que se encuentran próximos. Una forma de hacer esto es ordenar las distancias entre pares de objetos de acuerdo a la proximidad que existe entre.

3.- Determinedonde debe dividir el árbol de jerarquía de cúmulos.

Ejemplo 1.

Considere un conjunto de datos, C, el cual esta constituido por 5 objetos donde cada uno tiene las siguientes coordenadas.

objeto | x | y |
1 | 1 | 2 |
2 | 2.5 | 4.5 |
3 | 2 | 2 |
4 | 4 | 1.5 |
5 | 4 | 2.5 |

los cuales se muestran en la siguiente figura.

1.- Calculamos una matriz donde tenemos la informaciónde la distancia entre los puntos de la siguiente forma

| 1 | 2 | 3 | 4 | 5 |
1 | 0.0000 | 2.9155 | 1.0000 | 3.0414 | 3.0414 |
2 | 2.9155 | 0.0000 | 2.5495 | 3.3541 | 2.5000 |
3 | 1.0000 | 2.5495 | 0.0000 | 2.0616 | 2.0616 |
4 | 3.0414 | 3.3541 | 2.0616 | 0.0000 | 1.0000 |
5 | 3.0414 | 2.5000 | 2.0616 | 1.0000 | 0.0000 |

2.- Ordenamos las distancias entre objetos de menor a mayor1.0000 3.0000 1.0000
4.0000 5.0000 1.0000

3.0000 4.0000 2.0616
3.0000 5.0000 2.0616

2.0000 5.0000 2.5000
2.0000 3.0000 2.5495

2.0000 4.0000 2.9155
1.0000 4.0000 3.0414
1.0000 5.0000 3.0414
2.0000 4.0000 3.3541

Ligamos los datos que se encuentran mas cerca, para mostrar este procedimiento hacemos una gráfica

Este procedimiento puede llevarse a cabo en MATLAB de la siguienteforma.

Dados los datos.

1.- Calculamos la distancia entre los objetos utilizando

Y = pdist([x, y]); % calcula las distancias entre los objetos.
squareform(Y) % da la informacion en forma de matriz

La función pdist por default calcula la distancia euclidiana pero puede calcular otras medidas de distancia.

2.- Hacemos el ligado de objetos con la función

Z = linkage(Y); % hace elligado de los objetos
dendrogram(Z); % hace una grafica de las objetos ligados

3.- Para decidir los cúmulos utilizamos la función

T = CLUSTER(Z, 0.8)

donde Z son los valores ligados y el 0.8 indica el umbral al cual se quiere hacer la separación de cúmulos.

Análisis de MINITAB

Para llevar a cabo el análisis de cúmulos en MINITAB ir al menú

Stat > Multivariate > ClusterObservations …

Al seleccionar este menú aparece la caja de diálogo

Al llenar esta caja de diálogo obtenemos los siguientes resultados

Diferentes distancias

Distancia Euclidiana

La distancia euclidiana en tres dimensiones con p1 en (x1, y1, z1) y p2 en (x2, y2 ,z2) esta definida por d2 = (x1 – x2)2 + (y1 – y2)2 + … + (z1 – z2)2

Distancia Manhattan

La distancia entre dos puntoses media a los largo de los eje ortogonales. En un plano con p1 en (x1, y1) y p2 en (x2, y2), La distancia Manhattan es |x1 - x2| + |y1 - y2|. En la siguiente figura se ve en rojo como es calculada la distancia Manhattan.

Distancia de Pearson

Esta distancia esta basada en el coefficiente de correlación de Pearson el cuas es calculada a partir de valores muestrales y su desviación estandar....
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Lo Mejor De Lo Mejor
  • LO MEJOR DE LO MEJOR
  • lo mejor de lo mejor
  • Lo mejor de lo mejor
  • Lo Mejor De Lo Mejor
  • Lo Mejor De Lo Mejor
  • lo mejor de lo mejor
  • El mejor de los mejores

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS