Informatica

Páginas: 11 (2667 palabras) Publicado: 2 de junio de 2014
GENERAL ARQUITECTURE FOR TEXT
ENGINEERING (GATE)











MANUEL ALEJANDRO PLAZA ROJAS
DUVAN TOMBE
JORGE LUIS PEREZ
HERNAN DARIO MALES









INSTITUCIÓN UNIVERSITARIA COLEGIO MAYOR DEL CAUCA
FACULTAD DE INGENIERÍA
PROGRAMA DE INGENIERÍA INFORMÁTICA
METODOLOGÍA DE INVESTIGACIÓN
SÉPTIMO SEMESTRE
POPAYÁN 2014

GENERAL ARQUITECTURE FOR TEXT
ENGINEERING(GATE)











MANUEL ALEJANDRO PLAZA ROJAS
DUVAN TOMBE
JORGE LUIS PEREZ
HERNAN DARIO MALES

Trabajo de Investigación



ProfesorArmando Ordoñez, Docente de sistemas Distribuidos




INSTITUCIÓN UNIVERSITARIA COLEGIO MAYOR DEL CAUCA
FACULTAD DE INGENIERÍA
PROGRAMA DE INGENIERÍA INFORMÁTICA
METODOLOGÍA DE INVESTIGACIÓN
SÉPTIMO SEMESTRE
POPAYÁN 2014


1Tabla de contenido


















2 INTRODUCCIÓN

Hoy en día tenemos a nuestra disposición y en constante expansión sistemas de almacenamiento de información, como enormes colecciones texto, bibliotecas y sobre todo Internet. Pero los usuarios no necesitamos toda esa información por el contrario buscamos información específica. Es por ello que las herramientas que puedenidentificar y extraer información de estos sistemas de almacenamiento son indispensables.
Recuperación de la información (IR), se trata de devolver la información que es relevante para una consulta específica o campo de interés. Tenga en cuenta que esta información también puede ser en forma de documentos de carácter general, con toda seguridad los motores de búsqueda son un notable ejemplo detal tarea. Yo diría que las entidades más importantes reconocibles para la recuperación de información son el conjunto inicial de documentos / información y la consulta que especifica "qué buscar". Un aspecto de importancia cada vez mayor con respecto a los procesos de recuperación es el multilingüismo.Esto significa que la información solicitada se encuentra en los textos escritos en variosidiomas. CLIR(Cross- lingual Información Recuperación) es el área que tiene como objetivo desarrollar los sistemas de extracción de la información solicitada en base de una sola consulta.
La extracción de información (IE) es más acerca de cómo extraer (o deducir) conocimiento general (o relaciones) de un conjunto de documentos o información. Tenga en cuenta que aquí todo el contenido de losdocumentos puede ser considerado como un todo un corpus de datos a partir del cual extraer el conocimiento, con propiedades más específicas de dominio. La extracción de la información en su lugar podría pedir por ejemplo: extraer todos los nombres de las ciudades, o las direcciones de correo electrónico, que aparecen en un corpus de documentos. Incluso puede ser mucho más genérico, pidiendosimplemente para extraer conocimiento. Como se puede ver que esto es realmente genérico, por ejemplo, mediante la obtención de tripletes de la forma sujeto-acción-objeto para cada sentencia válida de un texto (este es el más adecuado para los textos en lenguaje natural).





3 EXTRACCIÓN DE LA INFORMACIÓN (IE)

IE es una tecnología que permite ser usada en otras aplicaciones:
Minería de texto.Anotación semántica.
Búsqueda de respuestas.
Minería de opiniones.
Soporte de decisiones.
Exploración y recuperación de la información.

Dos tipos principales de sistemas de IE:

Ingeniería del conocimiento
Se utiliza en muchos ámbitos de la informática, como la inteligencia artificial, incluyendo las bases de datos, minería de datos, bioinformática, sistemas expertos, sistemas de apoyoa las decisiones y sistemas de información geográfica. La ingeniería del conocimiento también está relacionado con la lógica matemática, así como está fuertemente involucrada en la ciencia cognitiva y la ingeniería socio-cognitivo, donde el conocimiento es producido por los agregados socio-cognitiva (principalmente humanos) y se estructura de acuerdo a nuestra comprensión de cómo funciona el...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Informatica
  • Informatica
  • Informatica
  • Informatica
  • Informatica
  • Informática
  • Informatica
  • Informatica

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS