Les règles de syntaxe de XML sont très simple et logique. Les règles sont faciles à apprendre et facile à utiliser.
Documents XML doit avoir un élément racine
Les documents XML doivent contenir un élément racine qui est le parent de tous les autres éléments:
<root>
<child>
<subchild>.....</subchild>
</child>
</root>
Dans cet exemple <note> est l'élément racine:
<?xml version="1.0" encoding="UTF-8 " ?>
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
Le XML Prolog
Cette ligne est appelée le prologue XML:
<?xml version="1.0" encoding="UTF-8 " ?>
Le prologue XML est facultative. Si elle existe, elle doit venir d'abord dans le document.
Les documents XML peuvent contenir des caractères internationaux, comme oa norvégien ou ee français.
Pour éviter les erreurs, vous devez spécifier l'encodage utilisé, ou sauvegarder vos fichiers XML en UTF-8.
UTF-8 est le codage de caractères par défaut pour les documents XML.
Le codage des caractères peut être étudié dans notre Jeu de caractères Tutorial .
UTF-8 est également l'encodage par défaut pour HTML5, CSS, JavaScript, PHP et SQL.
Tous les éléments XML doit avoir une balise de fermeture
En HTML, certains éléments pourraient bien fonctionner, même avec une balise de fermeture manquante:
<p>This is a paragraph.
<br>
En XML, il est illégal d'omettre la balise de fermeture. Tous les éléments must avoir une balise de fermeture:
<p>This is a paragraph.</p>
<br />
Le prologue XML n'a pas de balise de fermeture.
Ce n'est pas une erreur. Le prologue ne fait pas partie du document XML.
Balises XML sont sensibles à la casse
Les balises XML sont sensibles à la casse. La balise <Letter> est différente de la balise <letter> .
Ouverture et fermeture des balises doivent être écrites avec le même cas:
<Message>This is incorrect</message>
<message>This is correct</message>
"Ouverture et fermeture des balises" sont souvent désignés comme "Start and end tags" . Utilisez ce que vous préférez. Il est exactement la même chose.
Les éléments XML doivent être correctement imbriqués
En HTML, vous pouvez voir des éléments mal imbriqués:
<b><i>This text is bold and italic</b></i>
En XML, tous les éléments must être correctement imbriqués les uns dans les autres:
<b><i>This text is bold and italic</i></b>
Dans l'exemple ci - dessus, "Properly nested" signifie simplement que , depuis le <i> élément est ouvert à l' intérieur du <b> élément, il doit être fermé à l' intérieur du <b> élément.
Attribut XML Valeurs doivent être indiqués
Les éléments XML peuvent avoir des attributs de paires nom / valeur comme en HTML.
En XML, les valeurs d'attributs doivent toujours être cités.
INCORRECT:
<note date=12/11/2007>
<to>Tove</to>
<from>Jani</from>
</note>
CORRECT:
<note date="12/11/2007">
<to>Tove</to>
<from>Jani</from>
</note>
L'erreur dans le premier document est que la date d' attribut dans l'élément de la note est pas cité.
entité Références
Certains caractères ont une signification particulière en XML.
Si vous placez un personnage comme "<" dans un élément XML, il va générer une erreur parce que l'analyseur l' interprète comme le début d'un nouvel élément.
Cela va générer une erreur de XML:
<message>salary < 1000</message>
Pour éviter cette erreur, remplacez le "<" caractère avec une entity reference :
<message>salary < 1000</message>
Il y a 5 références d'entités prédéfinies en XML:
< | < | less than |
> | > | greater than |
& | & | ampersand |
' | ' | apostrophe |
" | " | quotation mark |
Seulement <et & sont strictement illégale en XML, mais il est une bonne habitude à remplacer> avec & gt; aussi bien.
Commentaires en XML
La syntaxe pour écrire des commentaires en XML est similaire à celle du HTML.
<! - Ceci est un commentaire ->
Deux tirets dans le milieu d'un commentaire ne sont pas autorisés.
Interdit:
<!-- This is a -- comment -->
Étrange, mais autorisés:
<!-- This is a - - comment -->
White-espace est préservé en XML
XML ne tronque pas plusieurs blancs-espaces (HTML tronque multiples blancs-espaces pour un espace blanc simple):
XML: | Hello Tove |
HTML: | Hello Tove |
XML Magasins New Line comme LF
Applications Windows stockent une nouvelle ligne comme: retour chariot et saut de ligne (CR+LF) .
Unix et Mac OSX utilise LF.
systèmes Old Mac utilise CR.
XML stocke une nouvelle ligne comme LF.
XML bien formés
Documents XML qui sont conformes aux règles de syntaxe ci - dessus sont dits "Well Formed" des documents XML.