Głównym budulcem obu dokumentach XML i HTML są elementami.
Budynek Bloki dokumentów XML
Patrząc z punktu widzenia DTD, wszystkie dokumenty XML są wykonane przez następujących bloków:
- Elements
- Attributes
- Entities
- PCDATA
- CDATA
Elementy
Elementy są main building blocks obu dokumentów XML i HTML.
Przykłady elementów HTML są "body" i "table" . Przykłady elementów XML może być "note" i "message" . Elementy mogą zawierać tekst, inne elementy lub być pusta. Przykłady pustych elementów HTML są "hr" , "br" i "img" .
Przykłady:
<body>some text</body>
<message>some text</message>
Atrybuty
Atrybuty dostarczenie extra information about elements .
Atrybuty są zawsze umieszczane w znaczniku otwierającym elementu. Atrybuty zawsze występują w parach nazwa / wartość. Poniższa "img" element posiada dodatkowe informacje o pliku źródłowym:
<img src="computer.gif" />
Nazwa elementu jest "img" . Nazwa atrybutu "src" . Wartość tego atrybutu jest "computer.gif" . Ponieważ sam element jest pusty to jest zamknięty " /" .
podmioty
Niektóre znaki mają specjalne znaczenie w XML, tak jak mniej niż znak (<) , który definiuje początek znacznika XML.
Większość z was wie podmiot HTML: " " , To "no-breaking-space" jednostka jest używana w HTML do wstawienia dodatkowego miejsca w dokumencie. Podmioty są rozszerzane, gdy dokument jest przetwarzany przez parser XML.
Następujące podmioty są predefiniowane w formacie XML:
podmiot Referencje | Postać |
---|---|
< | < |
> | > |
& | & |
" | " |
' | ' |
PCDATA
PCDATA oznacza przeanalizowane dane znakowe.
Pomyśl danych znakowych jako tekstu znalezionego między znacznikiem początkowym i końcowym znacznikiem elementu XML.
PCDATA is text that WILL be parsed by a parser . The text will be examined by the parser for entities and markup .
Tagi wewnątrz tekstu będą traktowane jako znaczniki oraz podmioty zostanie poszerzona.
Jednak przeanalizowane dane znakowe nie powinny zawierać żadnych &, <,> lub znaków; te muszą być reprezentowane przez & amp; & Lt; a & gt; podmioty, odpowiednio.
CDATA
CDATA oznacza dane znakowe.
CDATA is text that will NOT be parsed by a parser . Tagi wewnątrz tekst nie będą traktowane jako znaczniki oraz podmioty nie zostanie poszerzona.