Las reglas de sintaxis de XML son muy sencillo y lógico. Las reglas son fáciles de aprender y fácil de usar.
Los documentos XML debe tener un elemento raíz
Los documentos XML deben contener un elemento raíz que es el parent de todos los demás elementos:
<root>
<child>
<subchild>.....</subchild>
</child>
</root>
En este ejemplo <nota> es el elemento raíz:
<?xml version="1.0" encoding="UTF-8 " ?>
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
El XML Prolog
Esta línea se llama el prólogo XML:
<?xml version="1.0" encoding="UTF-8 " ?>
El prólogo XML es opcional. Si existe, tiene que venir por primera vez en el documento.
Los documentos XML pueden contener caracteres internacionales, como la OA noruego o ee francés.
Para evitar errores, se debe especificar la codificación utilizada, o guardar los archivos XML como UTF-8.
UTF-8 es la codificación de caracteres por defecto para documentos XML.
Codificación de caracteres puede ser estudiado en nuestro juego de caracteres Tutorial .
UTF-8 es también la codificación predeterminada para HTML 5, CSS, JavaScript, PHP y SQL.
Todos los elementos XML debe tener una etiqueta de cierre
En HTML, algunos elementos pueden funcionar bien, incluso con una etiqueta de cierre que falta:
<p>This is a paragraph.
<br>
En XML, es ilegal para omitir la etiqueta de cierre. Todos los elementos must tener una etiqueta de cierre:
<p>This is a paragraph.</p>
<br />
El prólogo XML no tiene una etiqueta de cierre.
Esto no es un error. El prólogo no es una parte del documento XML.
Etiquetas XML entre mayúsculas y minúsculas
Las etiquetas XML entre mayúsculas y minúsculas. La etiqueta <Letter> es diferente de la etiqueta <letter> .
las etiquetas de apertura y cierre deben ser escritos con el mismo procedimiento:
<Message>This is incorrect</message>
<message>This is correct</message>
"Etiquetas de apertura y cierre" se refieren a menudo como "Start and end tags" . Utilice lo que usted prefiere. Es exactamente lo mismo.
Elementos XML debe estar correctamente anidados
En HTML, es posible que vea indebidamente elementos anidados:
<b><i>This text is bold and italic</b></i>
En XML, todos los elementos must estar correctamente anidados unos dentro de otros:
<b><i>This text is bold and italic</i></b>
En el ejemplo anterior, "Properly nested" significa simplemente que ya que el <i> elemento se abre dentro de la <b> elemento, que debe estar cerrado dentro de la <b> elemento.
Los valores de atributos XML podrá ser citado
elementos XML pueden tener atributos de pares de nombre / valor al igual que en HTML.
En XML, los valores de los atributos siempre deben ser citados.
INCORRECTO:
<note date=12/11/2007>
<to>Tove</to>
<from>Jani</from>
</note>
CORRECTO:
<note date="12/11/2007">
<to>Tove</to>
<from>Jani</from>
</note>
El error en el primer documento es que la date atributo en el elemento de nota no es citado.
Las referencias de entidad
Algunos caracteres tienen un significado especial en XML.
Si se coloca un personaje como "<" dentro de un elemento XML, generará un error porque el analizador lo interpreta como el inicio de un nuevo elemento.
Esto generará un error de XML:
<message>salary < 1000</message>
Para evitar este error, sustituya el "<" personaje con una entity reference :
<message>salary < 1000</message>
Hay 5 predefinidos referencias a entidades en XML:
< | < | less than |
> | > | greater than |
& | & | ampersand |
' | ' | apostrophe |
" | " | quotation mark |
Sólo <e Y son estrictamente ilegal en XML, pero es un buen hábito para reemplazar> con & gt; así como.
Los comentarios en XML
La sintaxis para escribir comentarios en XML es similar a la de HTML.
<! - Esto es un comentario ->
Dos guiones en el medio de un comentario no están permitidos.
No permitido:
<!-- This is a -- comment -->
Extraño, pero permitidas:
<!-- This is a - - comment -->
Espacios en blanco se conserva en XML
XML no trunca múltiples espacios en blanco (HTML trunca múltiples espacios en blanco a un solo espacio en blanco):
XML: | Hello Tove |
HTML: | Hello Tove |
Tiendas XML New Line como LF
Aplicaciones de Windows almacenan una nueva línea como: retorno de carro y avance de línea (CR+LF) .
Unix y Mac OS X utiliza LF.
Los viejos sistemas Mac utiliza CR.
XML almacena una nueva línea como LF.
XML bien formado
Los documentos XML que se ajustan a las reglas de sintaxis anteriores se dice que están "Well Formed" documentos XML.