Основными строительными блоками как XML и HTML-документов являются элементами.
Строительные блоки XML-документов
Если смотреть с точки зрения DTD, XML все документы составлены с помощью следующих строительных блоков:
- Elements
- Attributes
- Entities
- PCDATA
- CDATA
элементы
Элементы являются main building blocks обоих XML и HTML - документов.
Примерами HTML - элементов являются "body" и "table" . Примерами элементов XML может быть "note" и "message" . Элементы могут содержать текст, другие элементы или быть пустым. Примеры пустых HTML - элементов "hr" , "br" и "img" .
Примеры:
<body>some text</body>
<message>some text</message>
Атрибуты
Атрибуты обеспечивают extra information about elements .
Атрибуты всегда помещаются внутри открывающего тега элемента. Атрибуты всегда приходят парами имя / значение. Следующий "img" элемент имеет дополнительную информацию о файле - источнике:
<img src="computer.gif" />
Имя элемента "img" . Имя атрибута является "src" . Значение атрибута является "computer.gif" . Поскольку сам элемент пустой , он закрыт " /" .
юридические лица
Некоторые символы имеют специальное значение в XML, как и тем меньше , чем знак (<) , который определяет начало XML - тега.
Большинство из вас знает HTML сущность: " " , Это "no-breaking-space" объект используется в HTML , чтобы вставить дополнительный пробел в документе. Объекты расширяются, когда документ обрабатывается с помощью XML-анализатором.
Следующие объекты предопределены в XML:
Entity Ссылки | символ |
---|---|
< | < |
> | > |
& | & |
" | " |
' | ' |
PCDATA
PCDATA означает разобранные символьные данные.
Подумайте о символьных данных, как текст находится между начальным тегом и конечным тегом элемента XML.
PCDATA is text that WILL be parsed by a parser , PCDATA is text that WILL be parsed by a parser с PCDATA is text that WILL be parsed by a parser . The text will be examined by the parser for entities and markup .
Метки внутри текста, будут рассматриваться как разметка и объекты будут расширены.
Тем не менее, разобранные символьные данные не должны содержать каких-либо &, <,> или символы; они должны быть представлены & Amp; & Л; и & GT; лица, соответственно.
CDATA
CDATA означает символьные данные.
CDATA is text that will NOT be parsed by a parser , CDATA is text that will NOT be parsed by a parser . Метки внутри текста не будет рассматриваться как разметка и юридические лица не будут расширены.