Retroalimentación de consultas

Solo disponible en BuenasTareas
  • Páginas : 12 (2939 palabras )
  • Descarga(s) : 0
  • Publicado : 28 de marzo de 2011
Leer documento completo
Vista previa del texto
1. Introducción

En las operaciones de Recuperación de Información (RI) la mayoría de los usuarios, los cuales no conocen los detalles de la estructura de la colección y del entorno de recuperación, encuentran difícil formular una pregunta bien diseñada para el propósito de recuperación que tienen. Esto sugiere que la primera operación de recuperación debe verse como un tanteo, como unaejecución de prueba solamente, cuyo objetivo es recuperar algunos elementos útiles a la colección dada. Estos elementos inicialmente recuperados pueden ser examinados entonces para ver su relevancia y puede entonces construirse una nueva y mejorada definición de la consulta con la aspiración de recuperar elementos adicionales útiles en las siguientes búsquedas.

La retroalimentación se produce cuandolas salidas del sistema o la influencia de las salidas del sistema en el contexto, vuelven a ingresar al sistema como recursos o información. Permite el control de un sistema y que el mismo tome medidas de corrección en base a la información retroalimentada.

La retroalimentación por relevancia es una de las más populares estrategias de modificación automática de consultas. La idea principalconsiste en una vez identificados ciertos documentos previamente recuperados como relevantes o irrelevantes, utilizar la información para adaptar la pregunta, de forma que se recuperen más documentos como los primeros y menos como los segundos (Salton y Buckley, 1990). El efecto de este proceso de alteración de la pregunta es el de “mover” la consulta en la dirección de los documentos relevantes yalejarla de los no relevantes, con la esperanza de recuperar así más documentos deseados y menos documentos no deseados en una búsqueda posterior. Esta técnica, introducida en los años sesenta, ha sido estudiada por numerosos investigadores hasta nuestros días, ya que se trata de un proceso extraordinariamente eficaz, capaz de mejorar en gran medida el comportamiento de un SRI, pero es en losúltimos años cuando han aparecido estudios que unen este concepto a lo que conocemos como Soft Computing; así, han aparecido trabajos que implementan la retroalimentación por relevancia aplicando lógica difusa o/y programación evolutiva (Yang y Korfhage, 1994; Robertson y Willet, 1996;Chen et al., 1998a y b; Horng y Yeh, 2000,López-Pujalte et al., 2002a, b y c; Kraft et al.,1997; Martín-Bautista et al.,1999; Cordón etal., 2000 y 2002).
La mayoría de dichos trabajos siguen el modelo vectorial y emplean algoritmos genéticos para implementar la técnica de retroalimentación. Esto no nos debe extrañar fundamentalmente por dos razones: por un lado, los espacios documentales derivados de la aplicación del modelo vectorial son espacios reales de grandes dimensiones donde se pueden utilizar AGs para suexploración en busca de mejores soluciones, ya que estos algoritmos han demostrados ser especialmente aptos para explorar espacios de esas características. Por otro lado, los AGs ya habían sido utilizados anteriormente para resolver problemas en los que el entorno proporcionaba una retroalimentación. En concreto eran utilizados para ajustar los parámetros, por ejemplo en simulaciones deyacimientos de petróleo, análisis de mercado, clasificación, etc.

3. Expansión de Consultas

Uno de los problemas más importantes en RI consiste en formular la consulta para que plasme adecuadamente la necesidad informativa del usuario. Aparte de los requerimientos del sistema para formalizar la consulta, el mayor problema consiste en determinar el conjunto de palabras que expresen semánticamente esanecesidad. El problema se agrava debido al efecto de inconsistencia en la asignación subjetiva de términos a conceptos. Figuras como la sinonimia o la polisemia (u otras menos importantes, como la homonimia, la antonimia, la hiperonimia, la hiponimia, o la anáfora) hacen que el mismo concepto pueda expresarse con palabras diferentes y una misma palabra pueda aparecer en documentos que tratan...
tracking img