Base de datos distribuidos
Procesamiento de Consultas
• Heterogeneidad de los datos: Desafío de desarrollar lenguajes que puedan ser usados para formular consultas que envuelvan modalidades múltiples de datos (ej. registros,texto, imágenes,video, sonido). Tema: Procesamiento de consultas sobre registros.
Regina Motz - InCo Consultas
INTEROPERABILIDAD
Procesamiento de
Procesamientode Consultas en BD Centralizadas
Consulta Parser Representacion Interna Optimizador Generador de código
Query trees Algebra relacional Reglas Heuristicas Modelo de Costo (Costo de: acceso a los datos, acceso al almacenam secundario, realizar computos.)
Regina Motz - InCo Consultas
INTEROPERABILIDAD
Procesamiento de
1
Procesamiento de Consultas en BD Distribuidas
Consulta ParserRepresentacion Interna Reformulación de consultas Transformar consultas globales en consultas equivalentes de más bajo nivel que se refieran a segmentos. Seleccionar la estrategia que minimiza el consumo de recursos.
Problemas: Reformulación de consultas Optimización de consultas
Optimización de consultas Generador de código
Regina Motz - InCo Consultas
INTEROPERABILIDADProcesamiento de
Procesamiento de Consultas en BD Distribuídas
• Datos compartidos a través de una red de nodos donde cada nodo es una BD Homogénea. – Localización de los datos para formular reglas heuristicas. – Descomposición
• Consultas en paralelo en cada nodo
– Costo de transferencia de los datos sobre la red.
• Reducir la cantidad de datos a transferir (ej. Semi-join)
Regina Motz - InCoConsultas
INTEROPERABILIDAD
Procesamiento de
Procesamiento de Consultas en BD Heterogéneas
Diferencias con BDDistribuidas: • Diferencias de capacidades en cada fuente
– Las fuentes pueden ser sistemas legados con interfaces a los datos muy limitadas. – Aún si todos los datos están almacenados en DBMS tradicionales estos pueden proveer acceso limitado por seguridad o performance. – Puedentener procesamientos de consultas adicionales
Regina Motz - InCo Consultas
INTEROPERABILIDAD
Procesamiento de
2
Procesamiento de Consultas en BD Heterogéneas (II)
Diferencias con BDDistribuidas: • Información sobre las fuentes y la red no disponible
– Costo local de las consultas es desconocido – Difícil de estimar las estadísticas sobre los datos – Costos de transferenciasimpredecibles
Regina Motz - InCo Consultas
INTEROPERABILIDAD
Procesamiento de
Procesamiento de Consultas en BD Heterogéneas
Problema de la Autonomía:
– Control completo sobre los datos locales – Sitios libres de unirse o no al sistema (autonom. de comunicación) – Optimizador de consultas locales (autonom. de diseño) (Hace que la estadistica global de costo quede desactualizada) – Cooperana través de la interface, no hay oportunidad de cooperación a bajo nivel (no semi-join)
Regina Motz - InCo Consultas
INTEROPERABILIDAD
Procesamiento de
Procesamiento de Consultas en BD Heterogéneas
Consulta Parser Query Decomposer Catalog Cost Evaluator Plan Generator
Component DB
Stadistics Manager
Dispatcher
Execution Monitor
Regina Motz - InCo ConsultasINTEROPERABILIDAD
Procesamiento de
3
Reformulación de Consultas (Query Decomposer)
Problema: Reformular la consulta global como consultas en las fuentes de información. Dados: • Una consulta Q en términos del esquema mediado (virtual approach) • Descripciones de las fuentes Encontrar: Una consulta Q’ que usa solo la información en las fuentes tal que: Q’ provee todas las posibles respuestas a Qusando las fuentes.
Regina Motz - InCo Consultas
INTEROPERABILIDAD
Procesamiento de
Descripción de las fuentes
Distintos encares de especificación: • Global As View (GAV): El esquema mediado es definido como vistas sobre los esquemas fuentes.
Por cada relación R en el esquema mediado, escribimos una consulta sobre las relaciones fuentes especificando como obtenemos las tuplas de R...
Regístrate para leer el documento completo.