Tendencias de las bases de datos

Solo disponible en BuenasTareas
  • Páginas : 12 (2859 palabras )
  • Descarga(s) : 0
  • Publicado : 26 de septiembre de 2010
Leer documento completo
Vista previa del texto
Tendencias actuales de Investigación en Bases de Datos

Objetivo : ! presentar un panorama de las tendencias de investigación en bases de datos y búsqueda de información. ! presentar los proyectos de investigación en los que estamos trabajando

En la actualidad, se trabaja en ... Datawarehouse Bases de datos espaciales, temporales …. Sistemas de recuperación de información Datos en la Web Datawarehouse Las aplicaciones de BD se pueden clasificar en: ! procesamiento de transacciones ! sistemas de ayuda a la decisión ! Almacenes de datos (Datawarehouse).
" "

Análisis de datos (OLAP). Minado de datos (Datamining).

Datawarehouse (DW)
es un depósito de información integrada a partir de varias fuentes guardada según un esquema unificado en un único lugar.

Fuente de datos 1Extraction Transformation Load

Fuente de datos 2 DW Fuente de datos n

DBMS herramientas de análisis y de consulta: OLAP, DM, ...

Problemas

! Esquema que debe utilizarse El DW debe: " integrar los esquemas (diseño) de las distintas fuentes de datos y " convertir los datos al esquema integrado antes de guardarlos.

! Momento y manera de recoger los datos
"

"

arquitecturaorientada a orígenes de datos (las fuentes de datos transmite la información nueva) arquitectura orientada a destinos de datos (el almacén de datos solicita los datos a las fuentes).

Problemas

! Propagación de las actualizaciones Si se modifican los esquemas (diseño) de los orígenes de datos, esto deberá propagarse al DW.

! Datos que se deben resumir
"

"

Los datos generados porsistemas transaccionales son grandes para almacenarlos. Muchas consultas para la toma de decisión se pueden resolver a partir de datos resumidos obtenidos por agregación.

OLAP: Análisis de datos
Para resumir los datos se utilizan: ! funciones de agregación
"

en SQL son limitadas => se extiende SQL existen extensiones de SQL
SELECT percentil, avg(saldo) FROM cuenta GROUPBY N_tile(saldo, 10)AS percentil

! histogramas
"

! agregación sobre varios atributos
"

tablas de referencias cruzadas
SELECT color talla, sum(numero) FROM ventas GROUPBY color, talla WITH CUBE.

Modelo n-dimensional (n atributos), generará un n-cubo de 2n vértices

Se definen operadores de refinamiento de consultas sobre n-cubos

Data Mining
Es la búsqueda de información de importancia ó“descubrimiento del conocimiento” en grandes volúmenes de datos. ! La información obtenida puede representarse mediante un conjunto de reglas. Ejemplo: “las mujeres jóvenes con ingresos mensuales superiores a $5000 son las personas con mayores probabilidades de comprar coches deportivos de tamaño pequeño”.

Tipos de reglas

Clasificación: Encontrar reglas que dividan los datos en grupos disjuntos.Intenta descubrir reglas que clasifiquen datos nuevos en base a datos históricos
Ejemplo: clasificar a un nuevo cliente para conceder ó no un crédito.

Asociación: Encontrar reglas que asocien datos de las transacciones.
Ejemplo: ! transacción T, compra (T,pan) # compra (T, leche) donde: T es una variable, rango(T) = {todas las transacciones}.

Bases de Datos Temporales
Ejemplo: ¿Quién hatrabajado en ventas más tiempo de lo que Juan trabajó con un sueldo de $20000? Aplicaciones: ! Bancarias, ! Controles de personal, ! Registros médicos, ! Inventario, ! Programación de reservas (avión, tren, hoteles...), ! Aplicaciones científicas (ej. monitoreo del tiempo).

! En una base de datos temporal cada hecho registrado tiene una marca de tiempo. ! Tiempo válido: conj. de intervalos de tdurante los que el hecho es verdadero. ! Tiempo de transacción: intervalo de t durante el cual ese hecho es cierto en el sistema de BD. ! Relación temporal:
" "

cada tupla tiene un t asociado cuando es verdadera. Se define Algebra Temporal, SQL Temporal

Bases de Datos Espaciales

Registran información en puntos, líneas y regiones. El espacio de interés puede ser:
" " "

"

Una...
tracking img