Arquitectura de un Crawler para Extraer las Estructuras y Contenidos de Recursos

Páginas: 3 (638 palabras) Publicado: 13 de noviembre de 2013
INSTITUTO TECNOLÓGICO DE VILLAHERMOSA.

Ingeniería Tecnologías de la Información y las Comunicaciones

Análisis de un trabajo de investigación:
Arquitectura de un Crawler para Extraer lasEstructuras y Contenidos de Recursos Electrónicos
Abimelec Hernández Cruz.
27/Marzo/2012



















De manera que hoy en día existe una inmensa cantidad de informaciónproveniente de distintas fuentes de consultas en internet, es fácil observar y consultar, pero difícilmente podemos convertirla en conocimiento. Se realiza un gran esfuerzo en algunas disciplinas paradesarrollar el concepto de la Web semántica y el objetivo de ello es ordenar en medio de la conglomeración el envío y recepción de información almacenada en internet.
Un subsistema muy importante de laherramienta, es la cache de descargas: gestiona las descargas de ficheros y páginas web, evita descargas y tratamientos duplicados, para hacer esto el subsistema mantiene un fichero XML con lainformación de las descargas realizadas almacenando su URL o dirección electrónica, por medio de fechas de consultas. Esta información es fundamental pues permite al subsistema de cache decidir si serealiza nuevamente la búsqueda y posteriormente la descarga de información.
También existe una tarea de extracción de información en una página , el sistema la utiliza para obtener un objeto que mantienela información relevante. Y toda esta información se consigue guardar en una base de datos semiestructurada(BDSE)
El trabajo de investigación presenta la arquitectura de una herramienta que permitela extracción d información de los recursos electrónicos, tanto de su contenido como de su estructura todo a un bajo costo tanto de recursos humanos y económicos. A diferencia de todos los métodosinductivos donde se extrae la información de forma automática, los crawlers es una herramienta que es programada para navegar por los recursos electrónicos y extraer solo la información que nos...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Ejercios Para El Batido De Crawl
  • Dise o de Estructuras Para Arquitectura
  • Estructura en Arquitectura
  • Arquitectura y estructuras
  • la estructura en la arquitectura
  • Estructura y contenido de un estudio de mercado
  • estructura y contenido de un plan de trabajo
  • CONTENIDO DE LOS ESQUEMAS ESTRUCTURA Y COMPETENCIA

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS