Algo

Páginas: 10 (2422 palabras) Publicado: 14 de febrero de 2013
Pre-procesamiento de conjuntos de entrenamiento no balanceados a través de la selección de objetos





INTRODUCCIÓN
Uno de los elementos fundamentales dentro de la Inteligencia Artificial (IA) y el Reconocimiento de Patrones (RP) es la capacidad de dar solución a problemas complejos. Para ello, se hace necesario el conocimiento del problema a resolver, como fuente principal de recursos.La adquisición de este conocimiento se realiza generalmente a través de la experiencia. Un caso particular de esto es el aprendizaje a partir de ejemplos. Dentro de éste, se encuentra la clasificación supervisada.
La clasificación supervisada se trata de que se conoce que un universo de objetos (instancias, ejemplos) se agrupa en un número de clases de las cuales se tiene, de cada una, unamuestra de objetos que se sabe pertenecen a ella y el problema consiste en dado un nuevo objeto poder establecer sus relaciones con cada una de dichas clases [1].
Una de las familias de algoritmos de clasificación supervisada más popular es la familia del k-NN, clasificador de los k vecinos más cercanos (Nearest Neighbors, por sus siglas en inglés) [2-5]. Este clasificador, para asignarle la clase aun objeto nuevo, lo compara con todos los objetos de la matriz de entrenamiento, utilizando una función de distancia, y determina los k objetos de la matriz de entrenamiento más cercanos al objeto dado. Finalmente, le asigna la clase mayoritaria. Este clasificador asume la existencia de una función de distancia para comparar los objetos por lo que los objetos tienen que estar representados en unespacio métrico. Una de sus ventajas es que no se usa ningún conocimiento explícito de la distribución subyacente de los datos [6], además, permite explicar por qué un objeto pertenece a determinada clase, retornando sus vecinos más cercanos. Este clasificador resulta además muy sencillo e intuitivo, y ha sido extendido al uso de funciones de similaridad a los k vecinos más similares (k-MSN)[7-10].
La utilidad del conocimiento extraído a partir de los datos mediante los métodos de aprendizaje automatizado depende en gran medida de la calidad de esos datos. De manera general, independientemente del clasificador supervisado que se utilice, la comunidad de IA y RP coincide plenamente en que la calidad de los resultados de clasificación estará dada en gran medida por la calidad del conjuntode entrenamiento. Si este no es representativo del problema que se investiga, posee ruido, o tiene objetos innecesarios o superfluos, el clasificador supervisado se verá afectado irremisiblemente, y se limitará la introducción de la clasificación automatizada a la práctica social.
Uno de los requerimientos más frecuentes es el de aumentar tanto la precisión del clasificador como su eficienciacomputacional. Es decir, se necesita un clasificador que clasifique bien, y que además lo haga con poco costo computacional, tanto de almacenamiento como de tiempo. Estos clasificadores deben ser precisos a la vez que rápidos, por lo que la mejora de su efectividad (eficacia y eficiencia) es central, ya que se aumentarían las clasificaciones correctas, se disminuiría el tiempo de cómputo, sedisminuirían los requisitos de almacenamiento, lo que se traduce en ahorros desde el punto de vista económico (menos computadoras, con menos prestaciones, menos gasto de corriente, etc.), así como mejoras sociales, dadas por más clasificaciones correctas y menos errores).
Adicionalmente, existen problemas en los cuales no hay claridad respecto a qué rasgos son relevantes para la tarea declasificación, y se incluyen varios de ellos para tratar de no perder ningún posible parámetro. Un ejemplo es el análisis de genes en que los rasgos relevantes son desconocidos a priori y varios rasgos candidatos se introducen para representar mejor el dominio del problema. Muchos de estos rasgos son completamente irrelevantes con respecto al proceso de clasificación, haciéndolo más complejo e introduciendo...
Leer documento completo

Regístrate para leer el documento completo.

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS