Base
Sistemas de Bases de Datos
Temario
1.- Arquitecturas de Bases de Datos 2.- Diseño Físico de Bases de Datos 3.- Procesamiento de Consultas y Transacciones
Bases de Datos Paralelas
Arquitecturas Paralelas para BD
• Alternativas Posibles:
• Memoria Compartida. • Disco Compartido. • Nada Compartido. • Arquitecturas Híbridas.
Arquitecturas Paralelas para BD
•Memoria Compartida: los procesadores comparten una memoria común y todos los discos del sistema.
P P P P M
Arquitecturas Paralelas para BD
• Memoria Compartida.
• Ventajas: gran eficiencia en la comunicación, mediante escrituras en la memoria; simplicidad para escribir software para este ambiente; equilibrio de cargas en tiempo de ejecución. • Problemas: alto costo por el tipo deinterconexión; extensibilidad limitada por la capacidad del bus; baja disponibilidad ante fallas del sistema.
Arquitecturas Paralelas para BD
• Disco Compartido: los procesadores comparten sólo los discos del sistema, pero tienen una memoria privada.
M M M M P P P P
Arquitecturas Paralelas para BD
• Disco Compartido.
• Ventajas: menor costo respecto del caso anterior; mayor extensibilidad porqueno comparten la memoria; mayor disponibilidad por fallas de la memoria. • Problemas: mayor complejidad al incorporar protocolos de bases de datos distribuidas (bloqueos, compromisos); coherencia de las copias; limitación por el subsistema de discos.
Arquitecturas Paralelas para BD
• Nada Compartido: los procesadores tienen una memoria privada y discos privados.
M P P M P M
ArquitecturasParalelas para BD
• Nada Compartido.
• Ventajas: costos bajos; gran extensibilidad para agregar más nodos en el sistema; mayor disponibilidad al replicar datos entre varios nodos. • Problema: más complejo que memoria compartida, por tener que agregar funciones de BD distribuidas; equilibrio de cargas es más difícil de alcanzar.
Arquitecturas Paralelas para BD
• Arquitecturas Híbridas:ejemplo de Clusters.
P P P P
M
P P P P
M
P P P P
M
Procesamiento Paralelo de Consultas
• Existen diversas formas procesamiento paralelo:
• Paralelismo de Entrada y Salida. • Paralelismo entre Consultas. • Paralelismo de Consulta. • Paralelismo Inter-Consulta.
de
implantar
Paralelismo de Entrada y Salida
• Persigue reducir el tiempo necesario para recuperar los datosde los archivos, particionando a éstos entre varios discos. • Técnicas existentes de Particionamiento:
• Round Robin. • por Hashing. • por Rangos. • por Listas.
Paralelismo de Entrada y Salida
• Particionamiento Round Robin:
• La relación se recorre en cierto orden, y la i-ésima tupla se envía al disco numerado con el valor Di mod n. • Recomendable para recorridos lineales, no paraconsultas puntuales o de rango.
#Tupla mod n = 1 ... #Tupla mod n = n - 1
#Tupla mod n = 0 ... ... ...
Particionamiento Round Robin
Paralelismo de Entrada y Salida
• Particionamiento por Hashing:
• Uno o más atributos de la relación se designan como atributos de la división, y una función hashing, es aplicada a dicho(s) atributo(s), de modo que el resultado indique el disco en donde se debeguardar cada tupla.
h(clave)=0 h(clave)=1 … h(…)=n-1
...
...
...
Paralelismo de Entrada y Salida
• Particionamiento por Hashing (cont.):
• Recomendable para consultas puntuales basadas en el atributo de particionamiento, y para recorridos lineales sobre la relación completa. • No lo es para consultas puntuales basadas en atributos que no son los del particionamiento, no tampoco paralas consultas de rango.
Paralelismo de Entrada y Salida
• Particionamiento por Hashing (cont.): SQL.
CREATE TABLE sales_hash (salesman_id NUMBER(5), salesman_name VARCHAR2(30), sales_amount NUMBER(10), week_no NUMBER(2)) PARTITION BY HASH(salesman_id) PARTITIONS 4 STORE IN (ts1, ts2, ts3, ts4);
Paralelismo de Entrada y Salida
• Particionamiento por Rangos.
• Distribuye rangos...
Regístrate para leer el documento completo.