การก่อสร้างตึกหลักของทั้งเอกสาร XML และ HTML เป็นองค์ประกอบ
การก่อสร้างตึกจากเอกสาร XML
เห็นได้จากจุด DTD ในมุมมองของเอกสาร XML ทั้งหมดจะทำขึ้นโดยการสร้างบล็อกต่อไปนี้:
- Elements
- Attributes
- Entities
- PCDATA
- CDATA
องค์ประกอบ
องค์ประกอบที่เป็น main building blocks ของทั้งสองเอกสาร XML และ HTML
ตัวอย่างขององค์ประกอบ HTML เป็น "body" และ "table" ตัวอย่างขององค์ประกอบ XML อาจจะ "note" และ "message" องค์ประกอบสามารถมีตัวอักษรองค์ประกอบอื่น ๆ หรือจะเป็นที่ว่างเปล่า ตัวอย่างขององค์ประกอบ HTML ที่ว่างเปล่า "hr" , "br" และ "img"
ตัวอย่าง:
<body>some text</body>
<message>some text</message>
แอตทริบิวต์
แอตทริบิวต์ให้ extra information about elements
แอตทริบิวต์จะอยู่เสมอภายในแท็กเปิดขององค์ประกอบ แอตทริบิวต์เสมอมาในชื่อ / คู่ค่า ต่อไปนี้ "img" องค์ประกอบมีข้อมูลเพิ่มเติมเกี่ยวกับแฟ้มแหล่งที่มา:
<img src="computer.gif" />
ชื่อขององค์ประกอบที่เป็น "img" ชื่อของแอตทริบิวต์เป็น "src" ค่าของแอตทริบิวต์เป็น "computer.gif" เนื่องจากองค์ประกอบของตัวเองเป็นที่ว่างเปล่าถูกปิดโดย " /"
หน่วยงาน
ตัวละครบางคนมีความหมายพิเศษในรูปแบบ XML เช่นเครื่องหมายน้อยกว่า (<) ที่กำหนดจุดเริ่มต้นของแท็ก XML นั้น
ส่วนใหญ่ของคุณรู้ว่านิติบุคคล HTML นี้: " " . นี้ "no-breaking-space" นิติบุคคลที่ถูกนำมาใช้ในรูปแบบ HTML เพื่อแทรกช่องว่างในเอกสาร หน่วยงานที่มีการขยายตัวเมื่อเอกสารถูกแยกวิเคราะห์โดย parser XML
หน่วยงานดังต่อไปนี้กำหนดไว้ล่วงหน้าในรูปแบบ XML:
เอนทิตี้อ้างอิง | ตัวละคร |
---|---|
< | < |
> | > |
& | & |
" | " |
' | ' |
PCDATA
PCDATA หมายความว่าข้อมูลตัวละครแจง
คิดว่าข้อมูลตัวอักษรเป็นข้อความที่พบระหว่างแท็กเริ่มต้นและแท็กสิ้นสุดขององค์ประกอบ XML
PCDATA is text that WILL be parsed by a parser The text will be examined by the parser for entities and markup
แท็กภายในข้อความที่จะถือว่าเป็นมาร์กอัปและหน่วยงานที่จะขยาย
อย่างไรก็ตามข้อมูลตัวอักษรแยกวิเคราะห์ไม่ควรมีการใด ๆ และ <หรือ> ตัวอักษร; เหล่านี้จะต้องแสดงโดย & amp; & lt; และ & gt; หน่วยงานตามลำดับ
CDATA
CDATA หมายความว่าข้อมูลตัวอักษร
CDATA is text that will NOT be parsed by a parser แท็กภายในข้อความจะไม่ได้รับการรักษาเป็นมาร์กอัปและหน่วยงานที่จะไม่ได้รับการขยายตัว