Motors de cerca

Solo disponible en BuenasTareas
  • Páginas : 16 (3917 palabras )
  • Descarga(s) : 0
  • Publicado : 4 de diciembre de 2010
Leer documento completo
Vista previa del texto
Breu descripció

Un motor de cerca adreçat al web està dissenyat per a buscar informació a la World Wide Web i a servidors FTP. Els resultats de la cerca es presenten generalment en un llistat de resultats. La informació pot consistir en pàgines web, imatges, informació i altres tipus d'arxius. Alguns motors de cerca també mostren les dades disponibles en bases de dades o directoris oberts. Adiferència de directoris web, que són mantinguts per editors humans, els motors de cerca operen mitjançant algoritmes o bé són una barreja d'algorismes d'entrada i mediació humana.

Història

Durant el desenvolupament primerenc de la web hi havia una llista de servidors web editat per Tim Berners-Lee allotjat a la web del CERN. A mesura que el número de servidors web en línia creix a aquestallista central li costa cada cop més mantenir el ritme. Al lloc web de la NCSA els nous servidors es presenten sota el títol "What’s new!"

La primera eina utilitzada per a la recerca a Internet es diu Archie. El nom és un sinònim d’ "archive" (arxiu) sense la "v". Creat el 1990 per Alan Emtage, Bill Heelan i J. Peter Deutsch, estudiants d'informàtica de la Universitat McGill de Montreal. Elprograma descarrega les llistes de directoris de tots els arxius ubicats a llocs FTP (File Transfer Protocol) públics anònims, creant una base de dades de noms d'arxiu. Archie, però, no indexa el contingut d'aquests llocs ja que la quantitat de dades és tan limitada que poden fer fàcilment cerques manuals.

El creixement de Gopher (creat el 1991 per Mark McCahill a la Universitat de Minnesota)comporta la creació de dos nous programes de cerca: Verónica i Jughead. Com Archie, aquestes dues aplicacions registren els noms dels fitxers i els títols emmagatzemats en els sistemes d'índex de Gopher. Verónica (Very Easy Net Rodent-Oriented Net-wide Index to Computerized Archives), fa una cerca de paraules clau de la majoria dels títols del menú de Gopher. Jughead (Jonzy's Universal Gopher HierarchyExcavation And Display) és una eina per obtenir informació específica del menú de servidors Gopher. Tot i que el nom d’"Archie" no fa referència a la sèrie d’historietes homònima, "Verónica" i "Jughead" sí són personatges d’aquesta sèrie, en clara referència al seu predecessor.

Fins l'estiu de 1993 no existeix cap motor de cerca adreçat a la web, tot i que sí que hi ha nombrosos catàlegsespecialitzats actualitzats manualment. Oscar Nierstrasz de la Universitat de Ginebra, escriu una sèrie d’scripts en Perl que periòdicament redunden aquestes pàgines i tornen a escriure-les en un format estàndard, servint de base per al W3Catalog, el primer i més primitiu motor de cerca adreçat al web, publicat el 2 de setembre de 1993.

El juny de 1993, Matthew Gray, llavors al MIT, crea el que vaser probablement el primer robot web, World Wide Web Wanderer, basat en Perl i que serveix per a generar un índex anomenat "wandex”. El propòsit de la Wanderer és mesurar la grandària de la World Wide Web, cosa que va fer fins a finals de 1995. El segon motor de cerca web va ser Aliweb que apareix el novembre de 1993. Aliweb no utilitza un robot web sinó que depèn de la notificació delsadministradors dels llocs web i de l'existència, en cada lloc, d'un arxiu d'índex en un format particular.
JumpStation (llançat el desembre de 1993) utilitza un robot web per trobar pàgines web i per construir el seu índex, emprant un formulari web com a interfície per al seu programa de consulta. Així doncs és la primera eina WWW de descobriment de recursos combinant les tres característiques essencialsd'un motor de cerca adreçat a la web (rastreig, indexació i cerca) com es descriu a continuació. A causa dels limitats recursos disponibles a la plataforma en què es va executar, la seva indexació i, en conseqüència, la recerca es limita als títols i capçaleres trobats pel rastrejador.

Un dels primers motors de cerca de "text complet" va ser WebCrawler, que apareix l’any 1994. A diferència...
tracking img