Valoraciones sobre la distancia entre objetos y determinación del número de clústeres.

Solo disponible en BuenasTareas
  • Páginas : 15 (3641 palabras )
  • Descarga(s) : 0
  • Publicado : 16 de mayo de 2011
Leer documento completo
Vista previa del texto
Universidad Central “Marta Abreu” de Las Villas
Facultad de Matemática Física y Computación










Informe de práctica laboral investigativa
Licenciatura en Matemática, 3er año

Tema: Análisis de clústeres |
Valoraciones sobre la distancia entre objetos y Determinación del número de clústeres. |
Autores: Maite Manzano Mendoza Enrique DansMoreno |
Tutor: Dr. C. Uvedel Bernabé Del Pino Paz 2010 Año 52 de la revolución |


Introducción

En el proyecto CITMA: “Desarrollo de nuevas técnicas estadísticas para el muestreo de poblaciones multivariadas” se tiene la tarea de encontrar estrategias que permitan obtener muestras capaces de reflejar esas poblaciones multivariadas.

Cuando se tienen poblaciones donde elnúmero de las variables aumenta, se hace difícil encontrar indicadores capaces de reflejar toda la variabilidad poblacional. Para contribuir a resolver esta dificultad, este proyecto propone el uso de los métodos de la estadística multivariada.

Una de las técnicas del análisis multivariado capaz de contribuir a la solución de esta tarea es el análisis de clústeres. En 1939, R. Tryon utiliza porprimera vez el término clústeres. En su libro Tryon desarrolla aplicaciones del análisis de clústeres a la Psicología.

Johnson Dallas (1998) expresa la siguiente idea: “la cuestión básica de un análisis de clústeres estudiar si es posible idear una clasificación ó esquema de agrupación que permita distribuir las unidades experimentales en clases ó grupos llamados clústeres, de modo que lasunidades que pertenezcan a un mismo clúster sean semejantes entre sí, en tanto que aquellas que pertenezcan a clústeres distintos sean distintas entre si”.

Las etapas a seguir en un análisis de clústeres son las siguientes:

1. Selección de la muestra de datos.
2. Selección y transformación de variables a utilizar.
3. Selección de concepto de distancia ó similitud y medición delas mismas
4. Selección y aplicación del criterio de agrupación.
5. Búsqueda de la estructura correcta (determinación del número de clústeres).

Selección de concepto de distancia ó similitud y medición de las mismas

Una vez hecha una adecuada selección de las variables a considerar, cada uno de los individuos sujetos al análisis vendrá representado por los valores que tomen estasvariables en cada uno de ellos. Este es el punto de partida de la agrupación. Para agrupar adecuadamente los individuos se debe determinar lo similares o disimilares (divergentes) que son entre sí, en función de lo diferentes que resulten ser sus representaciones en el espacio de las variables.

 Para medir lo similares (ó disimilares) que son los individuos existe una enorme cantidad deíndices de similaridad y de disimilaridad o divergencia. Todos ellos tienen propiedades y utilidades distintas y habrá que estar consciente de ellas para su correcta aplicación en cada caso.

La mayor parte de estos índices serán indicadores basados en la distancia (considerando a los individuos como vectores en el espacio de las variables) (en este sentido un elevado valor de la distancia entre dosindividuos nos indicará un alto grado de disimilaridad entre ellos); ó indicadores basados en coeficientes de correlación ó basados en tablas de datos de posesión de una serie de atributos.
 
Criterios basados en distancias como indicadores de disimilaridad

En general, el nombre de distancia o disimilaridad entre dos individuos x y y a una medida, indicada por d(x, y), que mide el gradode semejanza, ó mejor dicho de desemejanza, entre ambos objetos o individuos, en relación a un cierto número de características cuantitativa y/ó cualitativas. El valor de d(x, y) es siempre un valor no negativo, y cuanto mayor sea este valor mayor será la diferencia entre los individuos x y y.
Toda distancia debe cumplir las siguientes propiedades:
1. d(x, y) > 0 (no negatividad)
2....
tracking img