Procesamiento xml

Solo disponible en BuenasTareas
  • Páginas : 7 (1692 palabras )
  • Descarga(s) : 0
  • Publicado : 22 de septiembre de 2010
Leer documento completo
Vista previa del texto
Indice
Introducción a XML------------------------------------------------------------ 3
Historia--------------------------------------------------------------------------- 3
Sintaxis----------------------------------------------------------------------------------------4
Componentes de un documento-------------------------------------------------5
Declaraciones detipos DTD----------------------------------------------------------6
Identificar las clases en .NET involucrada con el “parsing ” y
Creación de documentos XML--------------------------------------------7
Document Object Model (DOM) --------------------------------------- 8
Validar datos en XML DTD--------------------------------------------------10
Validar datos en XMLSchema--------------------------------------------11
Bibliografía-----------------------------------------------------------------------12


Introducción a XML
Historia
XML proviene de un lenguaje inventado por IBM en los años setenta, llamado GML (Generalized Markup Language), que surgió por la necesidad que tenía la empresa de almacenar grandes cantidades de información. Este lenguaje gustó a la ISO, por loque en 1986 trabajaron para normalizarlo, creando SGML (Standard Generalized Markup Language), capaz de adaptarse a un gran abanico de problemas.
En el año 1989 Tim Berners Lee creó la web, y junto con ella el lenguaje HTML. Este lenguaje se definió en el marco de SGML y fue de lejos la aplicación más conocida de este estándar.
Los navegadores web sin embargo siempre han puesto pocas exigenciasal código HTML que interpretan y así las páginas web son caóticas y no cumplen con la sintaxis. Estas páginas web dependen fuertemente de una forma específica de lidiar con los errores y las ambigüedades, lo que hace a las páginas más frágiles y a los navegadores más complejos.
Otra limitación del HTML es que cada documento pertenece a un vocabulario fijo, establecido por el DTD. No se puedencombinar elementos de diferentes vocabularios. Asimismo es imposible para un intérprete (por ejemplo un navegador) analizar el documento sin tener conocimiento de su gramática (del DTD). Por ejemplo, el navegador sabe que antes de una etiqueta debe haberse cerrado cualquier previamente abierto. Los navegadores resolvieron esto incluyendo lógica ad hoc para el HTML, en vez de incluir un analizadorgenérico. Ambas opciones, de todos modos, son muy complejas para los navegadores.
Se buscó entonces definir un subconjunto del SGML que permita:
* Mezclar elementos de diferentes lenguajes. Es decir que los lenguajes sean extensibles.
* La creación de analizadores simples, sin ninguna lógica especial para cada lenguaje.
* Empezar de cero y hacer hincapié en que no se acepte nunca undocumento con errores de sintaxis.
Para hacer esto XML deja de lado muchas características de SGML que estaban pensadas para facilitar la escritura manual de documentos. XML en cambio está orientado a hacer las cosas más sencillas para los programas automáticos que necesiten interpretar el documento.
Sintaxis
Los documentos han de seguir una estructura estrictamente jerárquica con lo que respectaa las etiquetas que delimitan sus elementos. Una etiqueta debe estar correctamente incluida en otra, es decir, las etiquetas deben estar correctamente anidadas. Los elementos con contenido deben estar correctamente cerrados.
Los documentos XML sólo permiten un elemento raíz del que todos los demás sean parte, es decir, solo pueden tener un elemento inicial.
Los valores atributos en XML siempredeben estar encerrados entre comillas simples o dobles.
El XML es sensible a mayúsculas y minúsculas. Existe un conjunto de caracteres llamados espacios en blanco (espacios, tabuladores, retornos de carro, saltos de línea) que los procesadores XML tratan de forma diferente en el marcado XML.
Es necesario asignar nombres a las estructuras, tipos de elementos, entidades, elementos particulares,...
tracking img