両方のXMLおよびHTML文書の主なビルディングブロック要素です。
XML文書のビルディングブロック
ビューのDTD点から見ると、すべてのXML文書は、次のビルディングブロックによって作られています。
- Elements
- Attributes
- Entities
- PCDATA
- CDATA
要素
要素は、 main building blocksの両方のXMLおよびHTML文書の。
HTMLエレメントの例は、 "body"と"table" 。 XML要素の例としては、可能性があり"note"と"message" 。 要素は、テキスト、その他の要素が含まれている、または空にすることができます。 空のHTML要素の例は、 "hr" 、 "br"と"img" 。
例:
<body>some text</body>
<message>some text</message>
属性
属性は提供extra information about elements 。
属性は常に要素の開始タグの内側に配置されています。 常に名前/値のペアで来る属性。 以下の"img"要素は、ソース・ファイルに関する追加情報があります。
<img src="computer.gif" />
要素の名前は"img" 。 属性の名前は"src" 。 属性の値が"computer.gif" 。 要素自体は空であるので、それをすることによって閉鎖されます" /" 。
エンティティ
一部の文字が記号よりも少ないように、XMLで特別な意味を持っている(<) XMLタグの開始を定義します。
あなたのほとんどは、HTMLエンティティを知っている: " " 。 この"no-breaking-space"の実体は、文書内の余分なスペースを挿入するためにHTMLで使用されています。 文書はXMLパーサーによって解析されたときに実体が展開されます。
次のエンティティはXMLで事前定義されています。
実体参照 | キャラクター |
---|---|
< | < |
> | > |
& | & |
" | " |
' | ' |
PCDATA
PCDATAは、解析された文字データを意味します。
開始タグとXML要素の終了タグの間に見つかったテキストとして文字データと考えてください。
PCDATA is text that WILL be parsed by a parser 。 The text will be examined by the parser for entities and markup 。
テキスト内側のタグは、マークアップとして扱われ、エンティティが展開されます。
しかし、文字データは、任意の&、<、または>の文字を含めることはできません解析されました。 これらは、&#038で表される必要があります。 &LT; そして&GT; エンティティ、それぞれ。
CDATA
CDATAは文字データを意味します。
CDATA is text that will NOT be parsed by a parser 。 テキスト内側のタグはマークアップとして扱われず、実体は展開されません。