Ajaja

Páginas: 27 (6527 palabras) Publicado: 31 de enero de 2013
Ante tan vertiginosa evolución, no resulta sorprendente darse cuenta de que la gran mayoría de las personas que utilizan Google todos los días o escuchan hablar de ella no sepan, en realidad, como funciona. Para el usuario medio, el funcionamiento de Google es un misterio: no entienden cómo es capaz de brindar los mejores resultados en su buscador ni cómo puede valer tanto una empresa que nocobra prácticamente nada a sus usuarios. Pero tampoco se preocupan demasiado por entenderlo. Es como si el rutilante éxito de Google prevaleciese sobre la necesidad de explicación alguna para sus usuarios: funciona, y ya está. Para las empresas, sin embargo, no es así: en muchos países del mundo, tener una buena posición en Google cuando tus clientes potenciales buscan determinadas palabras significaya la diferencia entre el éxito y el fracaso. Cada día más, lo que no aparece en Google, no existe.
Situémonos en la cabeza de sus fundadores en 1999: hacer un doctorado en una de las universidades más prestigiosas de los Estados Unidos es una experiencia sumamente intensa. Los estudiantes doctorales llegan al punto de obsesionarse con sus temáticas, de vivirlas muy intensamente, y porqué no, deodiarlas también en determinadas ocasiones. Y uno de los momentos más importantes en esa denominada "grad-student life", o "vida del estudiante doctoral", es la decisión del tema de investigación. Así, cuando Larry Page y Sergey Brin empezaron a barajar la hipótesis de que analizar las relaciones en forma de enlaces entre páginas web era una mejor manera de calcular la relevancia que simplementecontar el número de apariciones de una palabra en ellas, cayeron en seguida en la cuenta de que tenían entre las manos algo muy importante.
Para entender la importancia de este hecho, demos un paso atrás e intentemos entender el funcionamiento de algo tan fundamental en la web como un motor de búsqueda: para desarrollar su trabajo, un motor de búsqueda no puede salir a buscar lo que un usuario lepide cada vez que éste introduce un término en la cajita correspondiente. Con la dimensión de la web, encontrar en tiempo real cuál es la página más relevante a ese término sería algo que llevaría no horas, sino seguramente días: los usuarios tendrían que enviar sus consultas y quedarse esperando a recibir el resultado, algo impensable. En su lugar, lo que hace un buscador es construir un índice,una base de datos propia, una especie de copia referenciada de la web. Para ello, desarrollan unos programas denominados "arañas", "bots", "spiders" o "crawlers", que llegan a una página y realizan un análisis de ésta, que suele denominarse "parsing" o, en versión castellano imposible, "parseado". Esto consiste en la obtención de métricas como las frecuencias de las palabras existentes en lapágina, la eliminación de artículos y otras palabras irrelevantes, las distancias relativas entre términos, la importancia o peso de los mismos en función de que estén en un título o en el cuerpo del texto, etc., que son inmediatamente almacenadas en una base de datos junto con la dirección de la página. Cuando la araña termina el análisis de una página, simplemente toma un vínculo en ella, y sedesplaza a otra página. Al llegar a la nueva página, debe primero comprobar si se encuentra ya en la base de datos. Si efectivamente es así, comprobará la versión existente en la base de datos con respecto a la que ha encontrado en la web, verificará la fecha de la última actualización, y si no ha habido cambios, continuará a la siguiente página. Si por el contrario, los ha habido, actualizará la base dedatos con los cambios correspondientes. Así, paso a paso, a una velocidad vertiginosa, la araña acaba construyendo una base de datos en la que se encuentran los análisis de una gran cantidad de páginas de la web. Una base de datos sobre la que, con la suficiente memoria y capacidad de proceso, sí es posible lanzar consultas con respecto a un término específico con posibilidades de devolver...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Ajaja
  • Ajaja
  • ajaja
  • Ajaj
  • Ajaj
  • Ajaja
  • ajaj nose
  • Ajaj

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS