I principali elementi costitutivi di entrambi i documenti XML e HTML sono elementi.
I mattoni di documenti XML
Visto da un punto di vista DTD, tutti i documenti XML sono costituiti dai seguenti elementi costitutivi:
- Elements
- Attributes
- Entities
- PCDATA
- CDATA
Elementi
Gli elementi sono i main building blocks di entrambi i documenti XML e HTML.
Esempi di elementi HTML sono "body" e "table" . Esempi di elementi XML potrebbe essere "note" e "message" . Gli elementi possono contenere testo, altri elementi, o essere vuoto. Esempi di elementi HTML vuoti sono "hr" , "br" e "img" .
Esempi:
<body>some text</body>
<message>some text</message>
attributi
Gli attributi forniscono extra information about elements .
Gli attributi sono sempre collocati all'interno del tag di un elemento di apertura. Attributi sempre venire in coppie nome / valore. Il seguente "img" elemento ha ulteriori informazioni su un file sorgente:
<img src="computer.gif" />
Il nome dell'elemento è "img" . Il nome dell'attributo è "src" . Il valore dell'attributo è "computer.gif" . Poiché l'elemento stesso è vuoto, è chiuso da una " /" .
Entità
Alcuni caratteri hanno un significato speciale in XML, come il segno di minore (<) che definisce l'inizio di un tag XML.
Molti di voi conoscono l'entità HTML: " " . Questo "no-breaking-space" entità è utilizzato in HTML per inserire uno spazio aggiuntivo in un documento. Le entità vengono espanse quando un documento viene analizzato da un parser XML.
Le seguenti entità sono predefiniti in XML:
riferimenti ad entità | Carattere |
---|---|
< | < |
> | > |
& | & |
" | " |
' | ' |
PCDATA
PCDATA significa che i dati di carattere analizzati.
Pensate di dati di carattere come il testo trovato tra il tag di apertura e il tag di chiusura di un elemento XML.
PCDATA is text that WILL be parsed by a parser . The text will be examined by the parser for entities and markup .
Tag all'interno del testo saranno trattati come markup e entità sarà ampliato.
Tuttavia, i dati di carattere analizzati non devono contenere alcun &, <, o> caratteri; questi devono essere rappresentato dal & amp; & Lt; e & gt; entità rispettivamente.
CDATA
CDATA significa dati di caratteri.
CDATA is text that will NOT be parsed by a parser . Tag all'interno del testo non saranno trattati come markup e gli enti non saranno ampliati.