Automatas

Páginas: 14 (3254 palabras) Publicado: 27 de mayo de 2013
Capítulo 2
Técnicas de Clasificación no
Supervisadas
1 Introducción
El aprendizaje no supervisado es muy importante cuando tenemos muestras sin
etiquetas de clase, cuando el costo de etiquetarlas por un experto es alto o cuando los
patrones pueden variar con el tiempo, por lo que es necesario primero procesar los
datos para luego clasificar. La principal ventaja que presenta laclasificación no
supervisada es que se puede obtener un conjunto de entrenamiento empleando
muestras no etiquetadas.
Actualmente, en muchas aplicaciones reales (biometría, categorización de
textos, búsqueda en bases de datos multimedia, reconocimiento de imágenes
multiespectrales, etc.), el coste de un conjunto de entrenamiento resulta bastante alto,
por lo que podría ser beneficioso aplicar primero adeterminadas muestras cuya clase
se desconoce, un algoritmo de agrupamiento para luego inferir propiedades en la
población en estudio. Se trata de construir clasificadores sin información previa, o
sea, a partir de objetos no etiquetados con el objetivo de descubrir la estructura de los
datos.
Bajo el nombre genérico de algoritmos de agrupamiento, se incluyen todo un
conjunto de procesos cuyafinalidad general será dividir un conjunto de objetos en
clases, para obtener un subconjunto representativo del conjunto de entrenamiento
inicial que posteriormente pueda utilizarse en una regla de clasificación supervisada.
En general, la clasificación no supervisada o agrupamiento (clustering)
consiste en dividir el conjunto de objetos en grupos de objetos similares llamados
clusters, demodo tal que objetos pertenecientes a un mismo grupo son más similares
que objetos de grupos diferentes.
El problema de formar grupos en un conjunto de datos es muy importante
para el conocimiento del comportamiento de una población, de la cual sólo se tiene
una cantidad N de sus elementos. Al estudiar el proceso de división en clases, nos
damos cuenta de que cada técnica está diseñada pararealizar una clasificación de tal

Capítulo 2
modo que cada grupo sea lo más homogéneo y lo más diferente de los demás como
sea posible. El resultado de cada método de agrupamiento dependerá del algoritmo
en concreto, del valor de los parámetros y de la medida de similaridad / disimilaridad
adoptada.
En la literatura consultada, los métodos de agrupamiento suelen dividirse de
diferentesmaneras, entre las que mencionaremos:
1. Teniendo en cuenta la existencia o no de una función criterio a optimizar:
1.1. Directos o heurísticos: son los que no optimizan ninguna función
objetivo.
1.2. Indirectos o por optimización: son los que optimizan alguna función
objetivo.
2. Según la construcción del agrupamiento:
2.1. Aglomerativos o incrementales (bottom-up), generalmente parten depatrones aislados y van uniendo grupos de acuerdo a alguna función
de similaridad / disimilaridad.
2.2. Divisivos o decrementales (top-down), parten de agrupamientos ya
establecidos, generalmente de un solo grupo, y van dividiendo los
grupos de partida hasta obtener grupos adecuados.
2.3. Mixtos, emplean diversas estrategias en su desempeño.
3. Según la información a priori acerca delconocimiento del número de
clusters:
3.1. Si se conoce el número de clusters.
3.2. Si no se conoce el número de clusters.
A partir de aquí, en este capítulo, nos centramos en el análisis de los aspectos
teóricos más relevantes de los métodos de clasificación no supervisada basados en la
estructura geométrica de los grupos, por lo que también haremos una breve
exposición de las métricas másutilizadas en la literatura consultada dedicada a este
tema y, posteriormente, formularemos las bases de los algoritmos de agrupamiento
probabilísticos. Además, haremos énfasis en los algoritmos relacionados con este
trabajo. Para ello, comenzaremos dando una visión general de cada técnica para,
posteriormente, pasar a presentar los diferentes algoritmos. Esta categorización de las
técnicas de...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Automata
  • Automatismos
  • automata
  • Automatas
  • Automatismo
  • Automatas
  • Autómatas
  • Automatismo

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS