Os principais blocos de construção de ambos os documentos XML e HTML são elementos.
Os blocos de construção de documentos XML
Visto de um ponto de vista DTD, todos os documentos XML são compostas pelos seguintes blocos de construção:
- Elements
- Attributes
- Entities
- PCDATA
- CDATA
elementos
Elementos são os main building blocks de ambos os documentos XML e HTML.
Exemplos de elementos HTML são "body" e "table" . Exemplos de elementos XML poderia ser "note" e "message" . Os elementos podem conter texto, outros elementos, ou estar vazio. Exemplos de elementos HTML vazias são "hr" , "br" e "img" .
Exemplos:
<body>some text</body>
<message>some text</message>
Atributos
Os atributos fornecem extra information about elements .
Os atributos são sempre colocadas dentro da tag de um elemento de abertura. Os atributos sempre vêm em pares nome / valor. O seguinte "img" elemento tem informações adicionais sobre um arquivo de origem:
<img src="computer.gif" />
O nome do elemento é "img" . O nome do atributo é "src" . O valor do atributo é "computer.gif" . Uma vez que o próprio elemento está vazio que é fechada por um " /" .
Entidades
Alguns caracteres têm um significado especial em XML, como o sinal de menor que (<) que define o início de uma tag XML.
A maioria de vocês sabe a entidade HTML: " " . Este "no-breaking-space" entidade é usada em HTML para inserir um espaço extra em um documento. Entidades são expandidas quando um documento é analisado por um parser XML.
As seguintes entidades são predefinidas no XML:
Referências de entidade | Personagem |
---|---|
< | < |
> | > |
& | & |
" | " |
' | ' |
PCDATA
PCDATA significa que os dados de caráter analisados.
Pense dados de caracteres como o texto encontrado entre a marca de início ea marca de fim de um elemento XML.
PCDATA is text that WILL be parsed by a parser . The text will be examined by the parser for entities and markup .
Tag dentro do texto será tratado como marcação e entidades serão expandidas.
No entanto, dados de caracteres analisados não deve conter nenhum &, <, ou> caracteres; estes precisam ser representado pelo & amp; & Lt; e & gt; entidades, respectivamente.
CDATA
CDATA significa dados de caracteres.
CDATA is text that will NOT be parsed by a parser . Tag dentro do texto não serão tratados como marcação e entidades não vai ser expandida.