Internet invisible

Solo disponible en BuenasTareas
  • Páginas : 11 (2574 palabras )
  • Descarga(s) : 0
  • Publicado : 11 de agosto de 2010
Leer documento completo
Vista previa del texto
Río Gallegos, 27 de agosto de 2007

Internet Invisible: lejanias virtuales, en búsqueda de archipiélagos de calidad.

Autor: Lic. Diego Fernando Pérez

Resumen:

Con el objetivo de profundizar las búsquedas de información en Internet y de localizar contenidos de calidad en la Web, es que surge este trabajo que busca mediante la investigación y análisis de los trabajos publicados sobre lainternet invisible, comprender el proceso de evolución del mismo. Sin duda, un mejor entendimiento acerca de la deep web sería de mucha ayuda para mejorar los métodos de recuperación de información, como asi también generar una guía de referencia para navegar por las profundidades de la World Wide Web.

¿Que es la web visible?

Comprende todos aquellos sitios cuya información puede serindexada por los robots de los buscadores convencionales y recuperada casi en su totalidad mediante una consulta a sus formularios de búsqueda.Mayoritariamente está formada por páginas web estáticas, es decir páginas o archivos con una URL fija y accesibles desde otro enlace.

¿Que es la Internet Invisible? (También llamada Internet Profunda, Internet Dinámica, Invisible Web, Deep Web)

Bergman(2001) en su trabajo sobre la internet invisible comenta que
los motores de búsqueda tradicionales crean sus indices a partir de robots que exploran la web en busca de paginas, en muchos casos ocurre que no pueden "ver" o recuperar determinados contenidos que forman parte de la internet invisible, lo que ocasiona esto es que para ser descubierta la dirección web tiene que ser estática o linkeada desdeotra pagina web y justamente las fuentes de la Deep Web depositan su contenido en bases de datos que solo producen resultados a través de paginas dinámicas en función de una pregunta directa. Esto es una de las razones por la cual los buscadores tradicionales no pueden llegar a recuperar estos recursos.

Isidro Agullo (2003) agrega que es el término utilizado para describir la información,generalmente almacenada y accesible mediante bases de datos, que no es recuperada interrogando a los buscadores convencionales. La internet invisible posee lo que él denomina archipielagos de calidad, que alude a los recursos que debido a procesos de control suelen presentar una elevada calidad.

Lewandowski (2006) resume y nos dice que la web invisible es una parte de la web que los buscadoresconvencionales no tienen agregada a sus indices, por muchas razones, pero principalmente, por cuestiones de espacio en sus servidores o por la imposibilidad técnica de indizar determinados formatos o contenidos.

Existen dos motivos fundamentales que explican por qué el contenido de Internet no está incluido en directorios o no es registrado por los motores de búsqueda: las barreras técnicas queimpiden el acceso y la elección de los propios buscadores a la hora de excluir algunos tipos de páginas web.
Las bases de datos de los buscadores son generadas por robots que navegan por Internet relevando el contenido de páginas estáticas, que para ser indexadas deben estar enlazadas desde otras páginas; si no existe un enlace a una página determinada, el robot no la puede ver. Estos robots quealimentan las bases de datos tampoco pueden registrar el contenido de las páginas a las que no pueden entrar, o bien porque requieren teclear algo (una palabra de acceso, por ejemplo) o bien porque es preciso elegir entre varias opciones para llegar al contenido.
De la incapacidad de los motores de búsqueda para penetrar en ciertas páginas nacen dos tipos de páginas invisibles.
• Los contenidosde bases de datos especializadas, dependiendo del número de páginas estáticas que contengan. Los resultados devueltos al efectuar una búsqueda en una base de datos se presentan normalmente mediante páginas dinámicas, es decir, páginas que se generan cada vez que se realiza una búsqueda y no se guardan en ningún sitio. Los robots no pueden encontrar las páginas que muestran el contenido de estas...
tracking img