Die wichtigsten Bausteine beider XML und HTML-Dokumente sind Elemente.
Die Bausteine von XML-Dokumenten
Aus einer DTD Sicht alle XML-Dokumente werden durch die folgenden Bausteine aus:
- Elements
- Attributes
- Entities
- PCDATA
- CDATA
Elements
Elemente sind die main building blocks beider XML und HTML - Dokumente.
Beispiele für HTML - Elemente sind "body" und "table" . Beispiele für XML - Elemente könnte sein , "note" und "message" . Die Elemente können Text, andere Elemente enthalten oder leer sein. Beispiele für leere HTML - Elemente sind "hr" , "br" und "img" .
Beispiele:
<body>some text</body>
<message>some text</message>
Attribute
Attribute liefern extra information about elements .
Attribute werden immer innerhalb der Öffnung Tag eines Elements platziert. Attribute kommen immer in Name / Wert-Paaren. Das folgende "img" Element hat zusätzliche Informationen über eine Quelldatei:
<img src="computer.gif" />
Der Name des Elements "img" . Der Name des Attributs "src" . Der Wert des Attributs "computer.gif" . Da das Element selbst leer ist , wird sie durch eine geschlossene " /" .
Entities
Einige Zeichen haben eine besondere Bedeutung in XML, wie die weniger - als - Zeichen (<) , die den Beginn eines XML - Tags definiert.
Die meisten von Ihnen kennen die HTML - Entität: " " . Diese "no-breaking-space" Entität wird in HTML verwendet , um einen zusätzlichen Platz in ein Dokument einzufügen. Entities werden erweitert, wenn ein Dokument durch einen XML-Parser analysiert wird.
Folgende Unternehmen sind in XML vordefiniert:
Entitätsverweise | Charakter |
---|---|
< | < |
> | > |
& | & |
" | " |
' | ' |
PCDATA
PCDATA bedeutet geparste Zeichendaten.
Denken Sie an Zeichendaten wie der Text zwischen dem Start-Tag und dem End-Tag eines XML-Elements gefunden.
PCDATA is text that WILL be parsed by a parser ein PCDATA is text that WILL be parsed by a parser der PCDATA is text that WILL be parsed by a parser . The text will be examined by the parser for entities and markup .
Tags innerhalb des Textes wird als Markup behandelt und Einheiten ausgebaut.
Allerdings analysiert Zeichendaten sollten nicht enthalten jede &, <oder> Zeichen; diese müssen durch die & amp vertreten zu sein; & Lt; und & gt; Entitäten, respectively.
CDATA
CDATA bedeutet Zeichendaten.
CDATA is text that will NOT be parsed by a parser der CDATA is text that will NOT be parsed by a parser , CDATA is text that will NOT be parsed by a parser . Tags innerhalb der Text wird nicht als Markup und Einrichtungen erweitert werden nicht behandelt werden.