要正確顯示HTML網頁,網頁瀏覽器必須知道的字符集(character encoding)使用。
什麼是字符編碼?
ASCII是第一個字符編碼標準 (也稱為字符集)。 它定義了可以在互聯網上使用127個不同的字母數字字符。
HTML(超文本標記語言)一直在使用自1991年以來,但HTML 4.0(1997年12月)是第一個標準化版本,其中國際字符均給予相當完整的治療。 當一個HTML文件包括七個位ASCII範圍以外的特殊字符的兩個進球都是值得考慮:信息的完整性和通用瀏覽器的顯示。
ASCII支持數字(0-9)英文字母(AZ)以及一些特殊字符,如! $ + - ( ) @ < > ! $ + - ( ) @ < >
ANSI (Windows-1252)是原來的Windows字符集。 它支持256個不同的字符代碼。
ISO-8859-1為默認字符集為HTML 4還支持256個不同的字符代碼。
因為ANSI和ISO有限,默認的字符編碼在HTML5改變為UTF-8。
UTF-8 (Unicode)涵蓋了幾乎所有世界上的字符和符號。
所有HTML 4處理器還支持UTF-8。
該HTML字符集屬性
要正確顯示HTML網頁,網頁瀏覽器必須知道在頁面中使用的字符集。
這是在指定<meta>標記:
對於HTML4:
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
對於HTML5:
<meta charset="UTF-8">
如果瀏覽器檢測到網頁中的ISO-8859-1,它默認為ANSI,因為ANSI是相同的ISO-8859-1除了ANSI有32個額外的字符。
字符集之間的差異
下表顯示上述字符集之間的差異:
Numb | ASCII | ANSI | 8859 | UTF-8 | 描述 |
---|---|---|---|---|---|
32 | 空間 | ||||
33 | ! | ! | ! | ! | 感嘆號 |
34 | " | " | " | " | 引號 |
35 | # | # | # | # | 數字符號 |
36 | $ | $ | $ | $ | 美元符號 |
37 | % | % | % | % | 百分號 |
38 | & | & | & | & | 符號 |
39 | ' | ' | ' | ' | 撇號 |
40 | ( | ( | ( | ( | 左括號 |
41 | ) | ) | ) | ) | 右括號 |
42 | * | * | * | * | 星號 |
43 | + | + | + | + | 加號 |
44 | , | , | , | , | 逗號 |
45 | - | - | - | - | 連字符減號 |
46 | . | . | . | . | 句號 |
47 | / | / | / | / | 固相線 |
48 | 0 | 0 | 0 | 0 | 數字零 |
49 | 1 | 1 | 1 | 1 | 數字一 |
50 | 2 | 2 | 2 | 2 | 數字2 |
51 | 3 | 3 | 3 | 3 | 數位三 |
52 | 4 | 4 | 4 | 4 | 數字4 |
53 | 5 | 5 | 5 | 5 | 位5 |
54 | 6 | 6 | 6 | 6 | 數字6 |
55 | 7 | 7 | 7 | 7 | 位7 |
56 | 8 | 8 | 8 | 8 | 數字8 |
57 | 9 | 9 | 9 | 9 | 數字9 |
58 | : | : | : | : | 結腸 |
59 | ; | ; | ; | ; | 分號 |
60 | < | < | < | < | 小於號 |
61 | = | = | = | = | 等號 |
62 | > | > | > | > | 大於號 |
63 | ? | ? | ? | ? | 問號 |
64 | @ | @ | @ | @ | 在商用 |
65 | A | A | A | A | 大寫拉丁字母A |
66 | B | B | B | B | 拉丁大寫字母B |
67 | C | C | C | C | 拉丁大寫字母C |
68 | D | D | D | D | 拉丁大寫字母D |
69 | E | E | E | E | 拉丁大寫字母E |
70 | F | F | F | F | 拉丁大寫字母F |
71 | G | G | G | G | 拉丁大寫字母G |
72 | H | H | H | H | 拉丁大寫字母H |
73 | I | I | I | I | 拉丁大寫字母我 |
74 | J | J | J | J | 拉丁大寫字母J |
75 | K | K | K | K | 拉丁大寫字母K |
76 | L | L | L | L | 拉丁大寫字母L |
77 | M | M | M | M | 拉丁大寫字母M |
78 | N | N | N | N | 拉丁大寫字母N |
79 | O | O | O | O | 拉丁大寫字母O |
80 | P | P | P | P | 拉丁大寫字母P |
81 | Q | Q | Q | Q | 拉丁大寫字母Q |
82 | R | R | R | R | 拉丁大寫字母R |
83 | S | S | S | S | 拉丁大寫字母S |
84 | T | T | T | T | 拉丁大寫字母T |
85 | U | U | U | U | 拉丁大寫字母U |
86 | V | V | V | V | 拉丁大寫字母V |
87 | W | W | W | W | 拉丁大寫字母W |
88 | X | X | X | X | 拉丁大寫字母X |
89 | Y | Y | Y | Y | 拉丁大寫字母Y |
90 | Z | Z | Z | Z | 拉丁大寫字母Z |
91 | [ | [ | [ | [ | 左方括號 |
92 | \ | \ | \ | \ | 反向固相線 |
93 | ] | ] | ] | ] | 右括號 |
94 | ^ | ^ | ^ | ^ | 抑揚音 |
95 | _ | _ | _ | _ | 低線 |
96 | ` | ` | ` | ` | 重音 |
97 | a | a | a | a | 拉丁文小寫字母a |
98 | b | b | b | b | 拉丁小字母b |
99 | c | c | c | c | 拉丁小字母c |
100 | d | d | d | d | 拉丁小字母d |
101 | e | e | e | e | 拉丁小字母e |
102 | f | f | f | f | 拉丁小字母f |
103 | g | g | g | g | 拉丁小字母G |
104 | h | h | h | h | 拉丁小字母h |
105 | i | i | i | i | 拉丁小字母i |
106 | j | j | j | j | 拉丁小字母J |
107 | k | k | k | k | 拉丁小字母k |
108 | l | l | l | l | 拉丁小字母l |
109 | m | m | m | m | 拉丁小字母m |
110 | n | n | n | n | 拉丁小字母n |
111 | o | o | o | o | 拉丁文小寫字母o |
112 | p | p | p | p | 拉丁小字母P |
113 | q | q | q | q | 拉丁小字母Q |
114 | r | r | r | r | 拉丁小字母R |
115 | s | s | s | s | 拉丁小字母s |
116 | t | t | t | t | 拉丁小字母T |
117 | u | u | u | u | 拉丁小字母u |
118 | v | v | v | v | 拉丁小字母v |
119 | w | w | w | w | 拉丁小字母w |
120 | x | x | x | x | 拉丁小字母x |
121 | y | y | y | y | 拉丁小字母Y |
122 | z | z | z | z | 拉丁小字母z |
123 | { | { | { | { | 左大括號 |
124 | | | | | | | | | 垂線 |
125 | } | } | } | } | 右花括號 |
126 | ~ | ~ | ~ | ~ | 波浪號 |
127 | DEL | ||||
128 | € | 歐元符號 | |||
129 | 不曾用過 | ||||
130 | ‚ | 單一的低9引號 | |||
131 | ƒ | 拉丁小字母f鉤 | |||
132 | „ | 雙低9引號 | |||
133 | … | 水平省略號 | |||
134 | † | 匕首 | |||
135 | ‡ | 雙匕首 | |||
136 | ˆ | 修飾符字母抑揚音 | |||
137 | ‰ | 千分數符號 | |||
138 | Š | 拉丁大寫字母S帶抑揚 | |||
139 | ‹ | 單左尖引號 | |||
140 | Œ | 拉美資本結紮OE | |||
141 | 不曾用過 | ||||
142 | Z | 帶抑揚拉丁大寫字母Z | |||
143 | 不曾用過 | ||||
144 | 不曾用過 | ||||
145 | ‘ | 左單引號 | |||
146 | ’ | 右單引號 | |||
147 | “ | 左雙引號 | |||
148 | ” | 右雙引號 | |||
149 | • | 子彈 | |||
150 | – | 破折號 | |||
151 | — | 破折號 | |||
152 | ˜ | 小波浪 | |||
153 | ™ | 商標標誌 | |||
154 | š | 拉丁小字母S帶抑揚 | |||
155 | › | 單右尖引號 | |||
156 | œ | 拉丁小繃帶OE | |||
157 | 不曾用過 | ||||
158 | z | 拉丁小字母Z帶抑揚 | |||
159 | Ÿ | 拉丁大寫字母Y及其二分法 | |||
160 | 無間斷空間 | ||||
161 | 倒感嘆號 | ||||
162 | ¢ | ¢ | ¢ | 百分號 | |
163 | £ | £ | £ | 英鎊符號 | |
164 | 貨幣符號 | ||||
165 | ¥ | ¥ | ¥ | 日元符號 | |
166 | ¦ | ¦ | ¦ | 豎槓 | |
167 | § | § | § | 部分標誌 | |
168 | ¨ | ¨ | ¨ | 二分法 | |
169 | © | © | © | 版權符號 | |
170 | ª | ª | ª | 女性順序指示符 | |
171 | « | « | « | 左指雙角引號 | |
172 | 不簽 | ||||
173 | | | | 軟連字符 | |
174 | ® | ® | ® | 註冊標誌 | |
175 | ¯ | ¯ | ¯ | 長音符號 | |
176 | ° | ° | ° | 度的標誌 | |
177 | ± | ± | ± | 正負號 | |
178 | ² | ² | ² | 上標2 | |
179 | ³ | ³ | ³ | 上標3 | |
180 | 銳音符 | ||||
181 | µ | µ | µ | 微符號 | |
182 | 段落符號標誌 | ||||
183 | · | · | · | 中間點 | |
184 | . | . | . | 變音符號 | |
185 | ª | ª | ª | 一個標 | |
186 | 陽剛順序指示符 | ||||
187 | » | » | » | 右指向雙角引號 | |
188 | 1/4 | 1/4 | 1/4 | 普通分數四分之一 | |
189 | 1/2 | 1/2 | 1/2 | 普通分數二分之一 | |
190 | 3/4 | 3/4 | 3/4 | 普通分數四分之三 | |
191 | 倒問號 | ||||
192 | À | À | À | 有嚴重的大寫拉丁字母A | |
193 | Á | Á | Á | 急性大寫拉丁字母A | |
194 | Â | Â | Â | 帶抑揚的大寫拉丁字母A | |
195 | Ã | Ã | Ã | 與波浪的大寫拉丁字母A | |
196 | Ä | Ä | Ä | 用二分法的大寫拉丁字母A | |
197 | Å | Å | Å | 以上環的大寫拉丁字母A | |
198 | Æ | Æ | Æ | 大寫拉丁字母AE | |
199 | C | C | C | 帶下加符的拉丁大寫字母C | |
200 | E | E | E | 拉丁大寫字母e為嚴重 | |
201 | E | E | E | 拉美資本字母E急性 | |
202 | E | E | E | 拉美資本字母E帶抑揚 | |
203 | E | E | E | 拉美資本字母E用二分法 | |
204 | I | I | I | 大寫拉丁字母我的墳墓 | |
205 | I | I | I | 大寫拉丁字母我急 | |
206 | I | I | I | 大寫拉丁字母我帶抑揚 | |
207 | I | I | I | 大寫拉丁字母我二分法 | |
208 | Ð | Ð | Ð | 大寫拉丁字母的Eth | |
209 | Ñ | Ñ | Ñ | 用波浪拉丁大寫字母N | |
210 | O | O | O | 拉丁大寫字母O與墳墓 | |
211 | O | O | O | 拉丁大寫字母O急性 | |
212 | O | O | O | 拉丁大寫字母O與抑揚 | |
213 | O | O | O | 拉丁大寫字母O與波浪 | |
214 | O | O | O | 拉丁大寫字母O與二分法 | |
215 | × | × | × | 乘號 | |
216 | Ø | Ø | Ø | 拉丁大寫字母O與中風 | |
217 | U | U | U | 拉丁大寫字母ü用嚴重 | |
218 | U | U | U | 拉丁大寫字母ü急性 | |
219 | U | U | U | 拉丁大寫字母ü用抑揚 | |
220 | U | U | U | 拉丁大寫字母ü用二分法 | |
221 | Y | Y | Y | 拉美資本字母Y急性 | |
222 | Þ | Þ | Þ | 大寫拉丁字母刺 | |
223 | ß | ß | ß | 小寫拉丁字母聲s | |
224 | a | a | a | 拉丁文小寫字母a與墳墓 | |
225 | a | a | a | 拉丁文小寫字母a急性 | |
226 | a | a | a | 拉丁文小寫字母a與抑揚 | |
227 | a | a | a | 拉丁文小寫字母a與波浪 | |
228 | a | a | a | 拉丁文小寫字母a與二分法 | |
229 | a | a | a | 拉丁文小寫字母a以上環 | |
230 | a | a | a | 小寫拉丁字母AE | |
231 | c | c | c | 拉丁小字母c有變音符號 | |
232 | e | e | e | 拉丁小字母e與墳墓 | |
233 | e | e | e | 拉丁小字母e急性 | |
234 | e | e | e | 拉丁小字母e帶抑揚 | |
235 | e | e | e | 拉丁小字母e與二分法 | |
236 | i | i | i | 拉丁小字母i與墳墓 | |
237 | i | i | i | 拉丁小字母i急性 | |
238 | i | i | i | 拉丁小字母i與抑揚 | |
239 | i | i | i | 拉丁小字母i與二分法 | |
240 | 小寫拉丁字母ETH | ||||
241 | n | n | n | 拉丁小字母n與波浪 | |
242 | o | o | o | 拉丁文小寫字母o與墳墓 | |
243 | o | o | o | 拉丁文小寫字母o急性 | |
244 | o | o | o | 拉丁文小寫字母o與抑揚 | |
245 | o | o | o | 拉丁文小寫字母O與波浪 | |
246 | o | o | o | 拉丁文小寫字母o用二分法 | |
247 | ÷ | ÷ | ÷ | 除號 | |
248 | 拉丁文小寫字母o與中風 | ||||
249 | u | u | u | 拉丁小字母U與墳墓 | |
250 | u | u | u | 拉丁小字母U急性 | |
251 | u | u | u | 小寫拉丁字母帶抑揚 | |
252 | u | u | u | 拉丁小字母U用二分法 | |
253 | y | y | y | 拉丁小字母Y急性 | |
254 | þ | þ | þ | 小寫拉丁字母刺 | |
255 | y | y | y | 拉丁小字母Y用二分法 |
ASCII字符集
ASCII使用從0到31的值(and 127)用於控制字符。
ASCII使用從32至126的值字母,數字和符號。
ASCII不使用值從128到255。
ANSI字符集(Windows-1252)
ANSI是相同的值ASCII從0到127。
ANSI具有用於從128到159的值的專有的字符集。
ANSI是相同的UTF-8為從160至255的值。
在ISO-8859-1字符集
8859-1是相同的值ASCII從0到127。
8859-1不使用的值從128到159。
8859-1是相同的UTF-8為從160至255的值。
在UTF-8字符集
UTF-8相同的值ASCII從0到127。
UTF-8不使用的值從128到159。
UTF-8是相同的ANSI和8859-1從160到255的值。
UTF-8從值256具有多於10個的不同的字符繼續。
仔細看看,學習我們的完整的HTML字符集的參考 。