Principalele elemente constitutive ale ambelor documente XML și HTML sunt elemente.
Cărămizile documentelor XML
Văzut dintr-un punct de vedere DTD, toate documentele XML sunt realizate prin următoarele blocuri de construcție:
- Elements
- Attributes
- Entities
- PCDATA
- CDATA
element
Elementele sunt main building blocks ale ambelor documente XML și HTML.
Exemple de elemente HTML sunt "body" și "table" de "table" . Exemple de elemente XML ar putea fi "note" și "message" . Elementele pot conține text, alte elemente, sau să fie gol. Exemple de elemente HTML goale sunt "hr" , "br" și "img" .
Exemple:
<body>some text</body>
<message>some text</message>
atribute
Atributele oferă extra information about elements .
Atributele sunt întotdeauna plasate în interiorul tag-ul de deschidere a unui element. Atributele întotdeauna vin în perechi nume / valoare. Următoarea "img" elementul are informații suplimentare despre un fișier sursă:
<img src="computer.gif" />
Numele elementului este "img" . Numele atributului este "src" . Valoarea acestui atribut este "computer.gif" . Deoarece elementul în sine este gol este închis cu un " /" .
entităţile
Unele personaje au o semnificație specială în XML, cum ar fi mai puțin decât semnul (<) , care definește începutul unei etichete XML.
Cele mai multe dintre voi cunoașteți entitatea HTML: " " . Acest "no-breaking-space" entitate este utilizată în HTML pentru a insera un spațiu suplimentar într - un document. Entitățile sunt extinse atunci când un document este analizat de către un parser XML.
Următoarele entități sunt predefinite în XML:
entitate Referințe | Caracter |
---|---|
< | < |
> | > |
& | & |
" | " |
' | ' |
PCDATA
PCDATA înseamnă date caracter parsate.
Gândiți-vă la date cu caracter ca text găsit între tag-ul de început și tag-ul final al unui element XML.
PCDATA is text that WILL be parsed by a parser de PCDATA is text that WILL be parsed by a parser . The text will be examined by the parser for entities and markup .
Tag-uri în text vor fi tratate ca marcare și entități va fi extins.
Cu toate acestea, datele caracter parsate nu trebuie să conțină și, <sau> caractere; acestea trebuie să fie reprezentat de & amp; & Lt; și & gt; entități, respectiv.
CDATA
CDATA înseamnă că datele cu caracter.
CDATA is text that will NOT be parsed by a parser un CDATA is text that will NOT be parsed by a parser de CDATA is text that will NOT be parsed by a parser . Tag-uri în interiorul text nu vor fi tratate ca marcaj și entitățile care nu vor fi extinse.