Kioooo

Páginas: 12 (2904 palabras) Publicado: 9 de octubre de 2011
EXTRACCIÓN DE INFORMACIÓN

INDICE:

• INTRODUCCIÓN A LA EXTRACCIÓN DE INFORMACIÓN (EI)

• SISTEMAS DE EXTRACCIÓN DE INFORMACIÓN (SEI): Objetivos y Problemas

• FUNCIONES DEL SISTEMA DE EXTRACCIÓN DE INFORMACIÓN (SEI)

• COMPONENTES TÍPICOS DE UN SISTEMA DE EXTRACCIÓN DE INFORMACIÓN (SEI)

• TIPOS DE DOCUMENTOS

• HERRAMIENTAS DE LOS SISTEMAS DEEXTRACCIÓN DE INFORMACIÓN (SEI)

• APLICACIONES A LA RECUPERACIÓN DE INFORMACIÓN (RI)

• PATRONES DE EXTRACCIÓN DE INFORMACIÓN (EI)

• BIBLIOGRAFIA

• RECUPERACIÓN DE INFORMACIÓN (enlaces de interés)

• MAPA DEL SITIO

• INTRODUCCIÓN A LA EXTRACCIÓN DE INFORMACIÓN (EI):

Actualmente, el concepto de Recuperación de Información se considera como la estrategia máscomún para hacer frente al caos que existe hoy día en la red. Pues hoy día, existen fuentes de información que son cada vez mayores, como por ejemplo, las inmensas colecciones de textos, librerías, y sobretodo Internet. La presencia, cada vez mayor, de una inmensa cantidad de textos en formato electrónico ha provocado dos grandes problemas: por una parte, la sobreabundancia de la información conocidocomo el fenómeno de “infoxicación”; y por otra parte, las dificultades para obtener información útil.

Ante esta situación, se plantean dos estrategias diferentes: la primera, sería la “recuperación de Información” y la segunda, la “Extracción de Información”. Estas dos estrategias se han convertido en herramientas imprescindibles para identificar y extraer la información concreta que elusuario busca en las distintas fuentes de información.

La diferencia entre los conceptos de Recuperación de Información (IR) y la Extracción de Información (EI) es la siguiente:
- La recuperación de información (RI), (en inglés information retrieval), es la ciencia de la búsqueda de documentos, de información concreta dentro de esos documentos, de los metadatos que describan los documentos y labúsqueda en las bases de datos y en la World Wide Web.

La IR es interdisciplinario, ya que es aplicable a muchas disciplinas, como por ejemplo, la informática, las matemáticas, la biblioteconomía, ciencias de la información, arquitectura de la información, psicología cognitiva, lingüística, estadística y física.

Por tanto, la recuperación de información se refiere al hecho de obtenerdocumentos que satisfagan una necesidad de información concreta que tiene el usuario.

- Extracción de Información (EI), (en inglés information extraction) es una disciplina dentro del procesamiento del lenguaje natural (PLN) que se considera un tipo de recuperación de información y su importancia vienen dado por la creciente cantidad de información no estructurada (es decir, sin metadatos) queexiste en Internet.

Realmente, la extracción de información automática ha desencadenado una revolución, marcando un antes y un después en el mundo de la recuperación de información. Si tradicionalmente, los usuarios recuperaban una gran cantidad de información y después, tras haber analizado los resultados recuperados, debían extraer la información de esos documentos; ahora la nueva tecnología deextracción de información automática (que está en proceso de desarrollo) pretende filtrar automáticamente los resultados, agilizando la obtención de la información útil por parte de los usuarios.

Así, la extracción de información se centra en localizar y extraer las partes del texto que contengan información relevante con el fin de satisfacer una necesidad concreta del usuario; y proporcionardicha información de forma adecuada para su procesamiento.

• SISTEMAS DE EXTRACCIÓN DE INFORMACIÓN (SEI): Objetivos y Problemas

El objetivo principal de los Sistemas de Extracción de Información (SEI) es obtener información relevante e ignorar la irrelevante. Tienen como objetivo obtener información acerca de hechos muy específicos (como fechas, nombres propios, eventos, relaciones...
Leer documento completo

Regístrate para leer el documento completo.

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS