Regulile de sintaxă XML sunt foarte simple și logice. Regulile sunt ușor de învățat, și ușor de utilizat.
XML Documentele trebuie să aibă un element rădăcină
Documentele XML trebuie să conțină un element rădăcină , care este parent tuturor celorlalte elemente:
<root>
<child>
<subchild>.....</subchild>
</child>
</root>
În acest exemplu <notă> este elementul rădăcină:
<?xml version="1.0" encoding="UTF-8 " ?>
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
Fișierul XML Prolog
Această linie se numește prolog XML:
<?xml version="1.0" encoding="UTF-8 " ?>
Prolog XML este opțională. În cazul în care există, trebuie să vină mai întâi în document.
Documentele XML pot conține caractere internaționale, cum ar fi norvegiană sau ee OA franceză.
Pentru a evita erorile, ar trebui să specificați codificarea utilizată, sau pentru a salva fișierele XML ca UTF-8.
UTF-8 este implicit codificarea caracterelor pentru documentele XML.
Codificare caractere pot fi studiate în nostru Set de caractere Tutorial .
UTF-8 este, de asemenea, codificarea implicită pentru HTML5, CSS, JavaScript, PHP și SQL.
Toate elementele XML trebuie să aibă o etichetă de închidere
In HTML, unele elemente ar putea să funcționeze bine, chiar și cu o etichetă de închidere lipsă:
<p>This is a paragraph.
<br>
În XML, este ilegal să omită de eticheta de închidere. Toate elementele must aibă o etichetă de închidere:
<p>This is a paragraph.</p>
<br />
Prolog XML nu are o etichetă de închidere.
Aceasta nu este o eroare. Prolog nu este o parte a documentului XML.
XML Etichetele sunt Case Sensitive
Etichetele XML sunt sensibile la litere. Eticheta <Letter> este diferit de tag - ul <letter> .
Deschiderea și închiderea tag-uri trebuie să fie scrise cu aceeași procedură:
<Message>This is incorrect</message>
<message>This is correct</message>
„Tag - uri Deschiderea și închiderea“ sunt adesea denumite "Start and end tags" - "Start and end tags" . Utilizați orice preferați. Este exact același lucru.
Elementele XML trebuie să fie îmbricate
In HTML, este posibil să vedeți elemente imbricate în mod necorespunzător:
<b><i>This text is bold and italic</b></i>
În XML, toate elementele must imbricate corect reciproc:
<b><i>This text is bold and italic</i></b>
In exemplul de mai sus, "Properly nested" înseamnă pur și simplu că , de <i> element este deschis în interiorul <b> elementul, acesta trebuie să fie închis în interiorul <b> element.
Valorile XML atribut trebuie să fie Quoted
Elementele XML pot avea atribute in perechi nume / valoare la fel ca și în HTML.
În XML, valorile atributelor trebuie să fie întotdeauna citat.
INCORECT:
<note date=12/11/2007>
<to>Tove</to>
<from>Jani</from>
</note>
CORECT:
<note date="12/11/2007">
<to>Tove</to>
<from>Jani</from>
</note>
Eroarea în primul document este că date atribut în elementul de notă nu este citat.
entitate Referințe
Unele personaje au o semnificație specială în XML.
Dacă puneți un personaj ca "<" în interiorul unui element XML, acesta va genera o eroare , deoarece parserul le interpretează ca începutul unui nou element.
Acest lucru va genera o eroare XML:
<message>salary < 1000</message>
Pentru a evita această eroare, înlocuiți "<" caracter cu o entity reference la o entity reference :
<message>salary < 1000</message>
Există 5 referinte entitate predefinite in XML:
< | < | less than |
> | > | greater than |
& | & | ampersand |
' | ' | apostrophe |
" | " | quotation mark |
Numai <și & sunt strict ilegale în XML, dar este un obicei bun pentru a înlocui> cu & gt; de asemenea.
Comentarii în XML
Sintaxa pentru scrierea comentariilor în XML este similar cu cel al HTML.
<! - Acesta este un comentariu ->
Două linii în mijlocul unui comentariu nu sunt permise.
Nepermis:
<!-- This is a -- comment -->
Ciudat, dar a permis:
<!-- This is a - - comment -->
Alb-spațiu este în XML Preserved
XML nu trunchia cu mai multe spații albe (HTML trunchiază cu mai multe spații albe la un singur spațiu alb):
XML: | Hello Tove |
HTML: | Hello Tove |
XML Magazine de New Line ca LF
Aplicații Windows stoca o nouă linie ca: transportul retur și linia de alimentare (CR+LF) .
Unix și Mac OSX utilizează LF.
Sistemele vechi de Mac utilizează CR.
XML stochează o nouă linie ca LF.
XML bine format
Documentele XML care sunt conforme cu normele de sintaxă de mai sus se spune că sunt "Well Formed" documente XML.