Sistemas de recuperación de información

Solo disponible en BuenasTareas
  • Páginas : 65 (16112 palabras )
  • Descarga(s) : 0
  • Publicado : 27 de marzo de 2011
Leer documento completo
Vista previa del texto
Volumen 3.

Ingeniería de los sistemas

96.

Sistemas de recuperación de la información
Autor: Julio Gilarranz Tejada (octubre de 2007)

Sumario 96.1. 96.2. 96.3. 96.3.1. 96.3.1.1. 96.3.1.2. 96.3.1.3. 96.3.1.4. 96.3.2. 96.3.2.1. 96.3.2.2. 96.3.2.3. 96.3.3. 96.4. 96.4.1. 96.4.1.1. 96.4.1.2. 96.4.2. 96.5. 96.5.1. 96.5.2. 96.6. 96.7. 96.8. 96.8.1. 96.8.2. 96.9. Introducción Conceptosbásicos Modelos y técnicas de recuperación Modelos clásicos Modelo booleano Modelo vectorial Modelo probabilístico Comparación entre los modelos clásicos Modelos avanzados Modelos basados en teoría de conjuntos Modelos algebraicos Modelos bayesianos Modelos estructurados Medidas de evaluación Enfoque tradicional Relevancia y pertinencia Principales medidas de evaluación Medidas relacionadas con elusuario Indexación y recuperación automáticas Índices invertidos Aplicación de técnicas de Lenguaje Natural Recuperación de información multimedia Búsquedas en la Web Técnicas relacionadas con la recuperación de información Extracción de Información (Information Extraction) Minería de textos (Text Mining) Conclusiones

____________________________________________________________

_______
96.Sistemas de recuperación de la información

1

Volumen 3. Ingeniería de los sistemas

96.1 Introducción Con el surgimiento y rápida expansión de los ordenadores a todos los ámbitos de la actividad diaria, se ha creado en la sociedad una necesidad de consumir gran cantidad de información. Dicha información está actualmente disponible de manera masiva a través de diversos medios, como Internet,pero en su mayor parte está en su formato bruto, datos. El objetivo de la Recuperación de la Información (Information Retrieval, IR) es permitir gestionar todo este volumen de datos textuales o multimedia de una manera eficiente y efectiva, de manera que se recupere la información pertinente de una manera rápida y sencilla. La Recuperación de la información es actualmente un campo multidisciplinarioen el que investigan, entre otros, bibliotecarios, lingüistas, psicólogos y especialistas en procesamiento de la información. Entre las líneas de trabajo que aborda se encuentran problemáticas documentales tan diversas como análisis de textos, indexación y representación, almacenamiento, compresión, acceso y presentación del conocimiento. Los Sistemas de Recuperación de Información permitenidentificar, de entre una colección de documentos, cuáles son relevantes a una consulta realizada por un usuario. Así, suelen estar integrados dentro de Gestores de Bases de Datos Documentales, para poder llevar a cabo las tareas de análisis, resumen, procesamiento requeridas que permitan tratar con textos completos. Estos gestores facilitan la conservación, recuperación y difusión de la informacióncontenida en los mismos. A diferencia de los Sistemas de Gestión de Bases de Datos Relacionales, orientados al manejo de datos estructurados y que utilizan un lenguaje de búsquedas que permiten concretar exactamente el conjunto de registros deseado, los sistemas de Recuperación de la Información trabajan con información no estructurada, mayoritariamente en formato texto (aunque últimamente se estátrabajando también con documentos multimedia). Además el volumen de información gestionada es muy elevado, del orden de gigabytes y superiores. Con el advenimiento de Internet y la World Wide Web, los aspectos relativos a la recuperación de documentos relevantes a la información deseada por los usuarios han impulsado aún más si cabe la investigación en las técnicas de recuperación de información. Eneste sentido, mencionar que los sistemas de Recuperación de Información más difundidos en la actualidad son los buscadores Web como Google™, que tratan de identificar los documentos de la World Wide Web que son de interés en una consulta formada por un conjunto de palabras determinado.

96.2 Conceptos básicos

Recuperación de Información frente a Recuperación de Datos La Recuperación de...
tracking img