Cu L Es La
La "web visibles" es lo que usted puede encontrar el uso de motores de búsqueda web general. Es también lo que se ve en casi todos los directorios temáticos. La "web invisible" es lo que usted no puede encontrar utilizando este tipo de herramientas.
La primera versión de esta página web fue escrito en 2000, cuando este temaera nuevo y desconcertante para muchos buscadores web. Desde entonces, los rastreadores de motores de búsqueda y los programas de indexación han superado muchas de las barreras técnicas que hicieron imposible para ellos encontrar "invisibles" páginas web.
Este tipo de páginas solían ser invisible, pero ahora se pueden encontrar en la mayoría de los motores de búsqueda:
Artículos en formatos queno sean HTML (pdf, Word, Excel, PowerPoint), ahora convertidos en HTML.
Páginas basadas-Script, cuyas direcciones URL contienen una? u otra secuencia de comandos de codificación.
Páginas generadas dinámicamente por otros tipos de software de base de datos (Server Pages por ejemplo, activos, ColdFusion). Estos pueden ser indexados si hay un URL estable en alguna parte que los rastreadores demotores de búsqueda puede encontrar.
¿Por qué es visible no todo?
Todavía hay algunos obstáculos rastreadores de motores de búsqueda no pueden saltar. Estos son algunos ejemplos de material que permanece oculto desde los motores de búsqueda generales:
El contenido de las bases de datos que se pueden buscar. Al realizar una búsqueda en un catálogo de la biblioteca, la base de datos del artículo, basede datos estadísticos, etc., los resultados se generan "al vuelo", en respuesta a su búsqueda. Debido a que los programas de cadenas no pueden escribir o pensar, no pueden introducir contraseñas en una pantalla de inicio de sesión o palabras clave en un cuadro de búsqueda. Por lo tanto, estas bases de datos deben ser registrados por separado.
Un caso especial: Google Académico es parte de la redpública o visible. Contiene citas de artículos de revistas y otras publicaciones, con enlaces a los editores u otras fuentes donde se puede tratar de acceder al texto completo de los artículos. Esto es conveniente, pero los resultados en Google Académico son sólo una pequeña fracción de todas las publicaciones académicas que existen en línea. Mucho más - incluyendo la mayor parte del texto completo- está disponible a través de las bases de datos de artículos que forman parte de la red invisible. El Berkeley Biblioteca UC suscribe a más de 200 de ellos, accesible a nuestros estudiantes, profesores, personal y visitantes en el campus a través de nuestra página Buscar artículos.
Páginas Excluidos. Compañías de motores de búsqueda no incluyen algunos tipos de páginas de la política, paraevitar que saturan sus bases de datos con contenidos no deseados.
Dinámicamente generados páginas de poco valor más allá de un solo uso. Piense en los miles de millones de posibles páginas web generadas por búsquedas de libros en los catálogos de bibliotecas, bases de datos pública récord, etc. Cada uno de ellos se crea en respuesta a una necesidad específica. Los motores de búsqueda no quieren todasestas páginas en sus bases de datos web, ya que generalmente no son de amplio interés.
Páginas deliberadamente excluidos por sus dueños. Un creador de la página web que no quiere a su su página de / a aparecer en los motores de búsqueda puede insertar "meta tags" especiales que no va a mostrar en la pantalla, pero hará que la mayoría de los rastreadores de motores de búsqueda para evitar lapágina.
Cómo encontrar el Web Invisible
Basta pensar en "bases de datos" y mantener los ojos abiertos. Usted puede encontrar las bases de datos de búsqueda que contienen las páginas web invisibles en el curso de la búsqueda de rutina en la mayoría de los directorios web generales. De valor particular en la investigación académica son:
ipl2
Infomine
Utilice Google y otros motores de búsqueda para...
Regístrate para leer el documento completo.