Sistema de archivos de google

Solo disponible en BuenasTareas
  • Páginas : 4 (847 palabras )
  • Descarga(s) : 0
  • Publicado : 6 de mayo de 2010
Leer documento completo
Vista previa del texto
EL SISTEMA DE ARCHIVOS DE GOOGLE

RESUMEN: Este documento pretende explicar el
funcionamiento del sistema de archivos de Google, el cual es un sistema de archivos distribuido y escalable paraaplicaciones distribuidas que acceden intensivamente a los datos.

PALABRAS CLAVE: cluster de computadoras.

1 INTRODUCCIÓN
El sistema de archivos de Google (GFS), es un sistema de almacenamientobasado en las necesidades de Google, el cual se basa en las siguientes premisas: El sistema está construido para que el fallo de un componente no le afecte. El sistema almacena grandes archivos Lamayoría del trabajo consiste en dos tipos de lecturas: grandes lecturas de datos y pequeñas lecturas aleatorias La carga de trabajo también consiste en añadir grandes secuencias de datos a archivos. Elsistema debe ser diseñado para ofrecer concurrencia a múltiples clientes que quieran el mismo archivo. Tener un gran ancho de banda prolongadamente es más importante que una baja latencia.

“master” ymúltiples “chunkserver” (servidores de partes) que dan servicio a múltiples clientes. Cada uno de estos servidores está normalmente implementado sobre una máquina Linux ejecutando el servidor como unproceso a nivel de usuario. Los archivos están divididos en trozos de tamaño fijo de 64 Mb y cada trozo es identificable por un número único de 64 bits, llamado chunk handle, que es asignado por elmaster cuando el trozo se crea. Por fiabilidad, cada trozo está replicado en varios chunkserver. El master es el encargado de mantener todos los metadatos del sistema de archivos. Eso incluye el espacio denombres, información para el control de acceso, el mapa con la distribución de archivos en los chunkserver y la localización actual de los trozos. Los clientes interactúan con el master para lasoperaciones de metadatos, pero todas las comunicaciones del traspaso de datos se realizan directamente con los chunkserver. Ningún cliente ni chunkserver mantiene una caché de datos. Los chunkserver...
tracking img