Page Rank

Páginas: 10 (2347 palabras) Publicado: 19 de mayo de 2013











PageRank



















Materia: Seminario de Base de Batos
Profesora: Cecilia Ruzz
Integrantes: Gallegos, Eduardo
Micciullo, Maximiliano
Russo, Santiago
Año: 2012
ÍNDICE

ÍNDICE 2
INTRODUCCIÓN 3
FUNCIONAMIENTO DE LOS PRIMEROS MOTORES DE BÚSQUEDA Y EL TERMINO SPAM 3
DEFINICIÓN Y CÁLCULO DE PAGERANK 4
CALLEJONES SIN SALIDA 6
TRAMPAS DEARAÑA Y TRIBUTACION (TAXATION) 6
USO DE PAGERANK EN UN MOTOR DE BÚSQUEDA. 7
EFICIENCIA EN EL COMPUTO DE PAGERANK. 7
MEJORAS PARA PAGERANK. 8
ALGORITMO HITS. 8

INTRODUCCIÓN

En este documento analizaremos como Google, por medio de la aplicación del algoritmo de PageRank, se diferenció del resto de los buscadores.

Sabemos que Google no fue el primer buscador que existió en Internet. Lospredecesores a él fueron varios, empezando por “Wandex” que surgió en 1993 junto con “Aliweb” que aún hoy está en funcionamiento, estos funcionaban por índice. El primer buscador por medio de texto completo fue “WebCrawler” en el año 1994 y a diferencia de los anteriores permitía a sus usuarios una búsqueda por palabras en cualquier página web. En ese año también se hizo conocido “Lycos” juntocon “Excite”, “Infoseek”, “Inktomi”, “Northem Light” y “Altavista”. Estos últimos competían con directorios o índices temáticos populares tales como “Yahoo!”.

Pero Google marcó entre todos ellos las búsquedas eficientes y precisas. Esto lo logró gracias a que fue el primero en ir derrotando a los “spammers” que habían hecho casi inútil las búsquedas, implementando de manera pionera el algoritmode PageRank.

A lo largo de este trabajo veremos como lo que es el algoritmo de PageRank y también como se calcula. Por último veremos algunas variaciones al algoritmo de PageRank.


FUNCIONAMIENTO DE LOS PRIMEROS MOTORES DE BÚSQUEDA Y EL TERMINO SPAM

Como mencionamos anteriormente, había muchos motores de búsqueda antes que Google. La mayor parte de ellos, trabajaban por método de“rastreo” de la Web y una lista de los términos (palabras u otras cadenas de caracteres que no sean espacio en blanco) que se encuentran en cada página, en un índice invertido. Un índice invertido es una estructura de datos que hace que sea fácil, habida cuenta de un término, para encontrar (punteros a) todos los lugares donde se produce ese término. Su funcionamiento es el siguiente: cuando se realiza unabúsqueda (lista de términos) se publica, las páginas con esos términos son extraídas del índice invertido y puestos de una manera que refleja el uso de los términos invertidos dentro de la página.

El termino “SPAM” surgió dado que la gente comenzó a utilizar a los buscadores como su camino inicial a los sitios a los que quería llegar; realizaban una búsqueda por ciertas palabras o términosrelacionados a lo que querían encontrar y el buscador les proporcionaba todo lo relacionado a ello. Pero el problema surgió dado que ciertas personas se dieron cuenta de este funcionamiento y vieron la oportunidad de aprovecharlo. La forma de aprovecharlo fue introducir en sus sitios webs palabras ocultas que fueran muy relevantes en las búsquedas más populares de la gente, como por ejemplo: película,fútbol, comprar, viajar, etc. De esta forma, agregaban muchas repeticiones ocultas de dichas palabras en sus sitios, y la persona al hacer una búsqueda de esos términos, obtenía por medio del buscador, sitios que nada tenían que ver con lo que realmente querían encontrar. Estos sitios estaban muy bien rankiados injustamente.

Para combatir al spam Google introdujo dos innovaciones:

1. PageRank.Páginas que tendrían un gran número de personas navegando se consideran más "importantes" que las páginas que rara vez se pueden visitar.
2. El contenido de una página fue juzgado no sólo por los términos que aparecen en esa página, sino por los términos utilizados en o cerca de los enlaces a esa página.

La importancia de las páginas web ahora se va a medir a partir de votos que los...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • ALGORITMO DE PAGE RANK
  • Rank
  • Otto Rank
  • Otto rank
  • Otto rank
  • Otto Rank
  • Ranke
  • Pagos

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS