629103
Páginas: 85 (21122 palabras)
Publicado: 26 de abril de 2015
INDUSTRIALES Y DE TELECOMUNICACIÓN
INGENIEROS
Titulación:
INGENIERO TÉCNICO EN INFORMÁTICA DE GESTIÓN
Título del proyecto:
Benchmarking Distributed System in the Cloud: Yahoo! YCSB
Alumna: Sana Nawazish Ali
Tutor: José Enrique Armendáriz Iñigo
Pamplona, Fecha de defensa
Sana Nawazish Alí
Universidad Pública de Navarra
Agradecimientos
Quiero aprovechar estasprimeras líneas para agradecer a mi tutor: José
Enrique Armendáriz Iñigo por su dedicación, su esfuerzo, paciencia y todo el
conocimiento que me ha aportado.
Además, dado que con este documento cerraré un ciclo, quiero acordarme
también de mis compañeros de la carrera, especialmente de Ander y César
que han sido un gran apoyo durante todos estos años.
Por supuesto, no puedo dejar de lado a mifamilia, que han sido una
fuente de apoyo todos estos años, muchas gracias por vuestra paciencia.
Por último mi mayor fuente de inspiración quiero agradecer a Daniel
Ventura por todo su apoyo y ayuda.
2
Sana Nawazish Alí
Universidad Pública de Navarra
Índice
Capítulo 1. INTRODUCCIÓN ............................................ 8
1.1.
Objetivo del proyecto................................................... 8
1.2.
Descripción del proyecto ............................................. 9
1.3.
Justificación de la tecnología .................................... 10
Capítulo 2. YCSB................................................................ 11
2.1.
Introducción ............................................................... 11
2.2.
Descargar YCSB........................................................ 12
2.3.
Ejecución de una carga de trabajo ........................... 13
Capítulo 3. Bases de Datos No-Relacionales .................... 15
3.1.
Introducción ............................................................... 15
3.2.
Tipos de bases de datos NoSQL ................................ 16
3.3.
Características............................................................ 17
3.4.
Modelos de implementación ...................................... 18
3.5.
Punto débil: Consistencia .......................................... 18
3.6.
SQL vs NoSQL ........................................................... 19
Capítulo 4. Hadoop ............................................................. 21
4.1.
Introducción............................................................... 21
4.2.
Características ............................................................ 22
4.3.
Distribuciones y Versiones de Hadoop ..................... 23
4.4.
Arquitectura ............................................................... 25
4.5.
Modos de ejecución de Hadoop ................................ 29
4.6.
Inconvenientes............................................................ 29
4.7.
El ecosistema de Hadoop ........................................... 30
3
Sana Nawazish Alí
Universidad Pública de Navarra
4.8.
Ficheros de configuración ......................................... 32
4.9.
Hadoop en la actualidad ............................................ 32
Capítulo 5. HBase............................................................... 34
5.1.
Introducción ............................................................... 34
5.2.
Características ............................................................ 35
5.3.
Arquitectura ............................................................... 36
5.4.
Flujo de datos ............................................................. 38
5.5.
Réplicas....................................................................... 39
5.6.
HBase filesystems ....................................................... 42
5.7.
Modos de ejecución .................................................... 43
5.8.
Ficheros de configuración ......................................... 43
Capítulo 6. Cassandra ........................................................ 45
6.1.
Introducción...
Leer documento completo
Regístrate para leer el documento completo.