xml y bd
CON BASES DE DATOS
Tema 4
XML Y BASES DE DATOS
Objetivos
• Presentar los modelos de datos semiestructurados.
• Dar a conocer la importancia del XML, sus
•
•
características, sus componentes y su relación con las
bases de datos.
Conocer que es una base de datos XML.
Presentar algunos SGBD que soportan XML.
DASBD Curso 2006/2007
4. 2
1Contenido
• Introducción
Introducció
Nivel de estructuración de datos
estructuració
Bases de datos documentales
Integración de datos muy estructurados y poco estructurados
Integració
• XML
Estructura de datos y documentos
Esquemas
Consultas y transformación – XQuery
transformació
• XML y Bases de Datos
Sistemas de bases de datos nativos XML
Integración de XML en otros SGBDIntegració
DASBD Curso 2006/2007
4. 3
Bibliografía
Connolly y Begg (2005)
Cap. 30
Cap.
Elmasri y Navathe (2004)
Cap. 26
Cap.
Silberschatz et al. (2002)
Cap. 10
Cap.
DASBD Curso 2006/2007
4. 4
2
Introducción
Introducció
Nivel de Estructuración de Datos
• Datos estructurados
•
•
representados en un
formato estricto (relaciones/tablas)
Datossemi-estructurados
los datos tienen
una cierta estructura pero no toda la
información recogida tiene la misma estructura
(grafos)
Datos desestructurados
hay una indicación
muy limitada del tipo de datos (documentos de
texto, archivos de video)
DASBD Curso 2006/2007
4. 5
Introducción
Introducció
Bases de Datos Documentales
• Están orientadas a almacenar datos desestructurados
Está
detipo texto.
• Carecen de una estructura tabular y contienen
•
•
información bibliográfica y/o el texto completo de los
informació bibliográ
documentos.
Los modelos de información consideran que cada
informació
documento se describe con un conjunto de palabras
clave significativas (llamadas índices).
ndices).
Los índices se utilizan para indexar y resumir el
contenido de losdocumentos, ayudando a su gestión.
gestió
DASBD Curso 2006/2007
4. 6
3
Introducción
Introducció
Integración de Datos
• En la actualidad es una necesidad integrar los datos
muy estructurados con los poco estructurados.
estructurados.
La principal diferencia entre ambos es la forma de manejar los
constructores del esquema (nombres de atributos, relaciones y
tipos de entidades,etc.)
En el caso de los poco estructurados, la información del
informació
esquema se mezcla con los valores de los datos ya que un
objeto de datos puede tener diferentes atributos no conocidos
por adelantado. Por eso, estos tipos de datos se conocen como
datos autodescriptivos.
autodescriptivos.
DASBD Curso 2006/2007
4. 7
Introducción
Introducció
Integración de Datos
•Queremos
•
•
•
•
Ejemplo:
recolectar una lista de referencias bibliográficas
relacionadas a un proyecto de investigación. Algunas pueden ser
libros otras informes técnicos, otras números especiales de revistas
o actas de congresos.
Claramente cada uno de estas pueden tener atributos y diferente
tipo de información.
Aún para el mismo tipo de referencia, por ejemplo artículos decongresos, podemos tener diferente información.
Por ejemplo, una referencia a un artículo puede estar muy
completa , con toda la información de los autores, título, actas,
número de páginas, y demás, mientras que otra referencia puede
no tener toda la información.
Nuevos tipos de referencias pueden aparecer con el tiempo, por
ejemplo referencias a páginas Web o a tutoriales de conferencias,
ypueden tener diferentes atributos.
DASBD Curso 2006/2007
4. 8
4
XML
• XML (eXtensible Markup Language)
• XML es descendiente de SGML (Standard Generalized Markup
Language), que fue creado en los 80, pero que tiene como
principal problema su complejidad.
• HTML se creó para publicar información en Internet, pero con él
solo se puede formatear texto, no describe...
Regístrate para leer el documento completo.