要正确显示HTML网页,网页浏览器必须知道的字符集(character encoding)使用。
什么是字符编码?
ASCII是第一个字符编码标准 (也称为字符集)。 它定义了可以在互联网上使用127个不同的字母数字字符。
HTML(超文本标记语言)一直在使用自1991年以来,但HTML 4.0(1997年12月)是第一个标准化版本,其中国际字符均给予相当完整的治疗。 当一个HTML文件包括七个位ASCII范围以外的特殊字符的两个进球都是值得考虑:信息的完整性和通用浏览器的显示。
ASCII支持数字(0-9)英文字母(AZ)以及一些特殊字符,如! $ + - ( ) @ < > ! $ + - ( ) @ < >
ANSI (Windows-1252)是原来的Windows字符集。 它支持256个不同的字符代码。
ISO-8859-1为默认字符集为HTML 4还支持256个不同的字符代码。
因为ANSI和ISO有限,默认的字符编码在HTML5改变为UTF-8。
UTF-8 (Unicode)涵盖了几乎所有世界上的字符和符号。
所有HTML 4个处理器还支持UTF-8。
该HTML字符集属性
要正确显示HTML网页,网页浏览器必须知道在页面中使用的字符集。
这是在指定<meta>标记:
对于HTML4:
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
对于HTML5:
<meta charset="UTF-8">
如果浏览器检测到网页中的ISO-8859-1,它默认为ANSI,因为ANSI是相同的ISO-8859-1除了ANSI有32个额外的字符。
字符集之间的差异
下表显示上述字符集之间的差异:
Numb | ASCII | ANSI | 8859 | UTF-8 | 描述 |
---|---|---|---|---|---|
32 | 空间 | ||||
33 | ! | ! | ! | ! | 感叹号 |
34 | " | " | " | " | 引号 |
35 | # | # | # | # | 数字符号 |
36 | $ | $ | $ | $ | 美元符号 |
37 | % | % | % | % | 百分号 |
38 | & | & | & | & | 符号 |
39 | ' | ' | ' | ' | 撇号 |
40 | ( | ( | ( | ( | 左括号 |
41 | ) | ) | ) | ) | 右括号 |
42 | * | * | * | * | 星号 |
43 | + | + | + | + | 加号 |
44 | , | , | , | , | 逗号 |
45 | - | - | - | - | 连字符减号 |
46 | . | . | . | . | 句号 |
47 | / | / | / | / | 固相线 |
48 | 0 | 0 | 0 | 0 | 数字零 |
49 | 1 | 1 | 1 | 1 | 数字一 |
50 | 2 | 2 | 2 | 2 | 数字2 |
51 | 3 | 3 | 3 | 3 | 数位三 |
52 | 4 | 4 | 4 | 4 | 数字4 |
53 | 5 | 5 | 5 | 5 | 位5 |
54 | 6 | 6 | 6 | 6 | 数字6 |
55 | 7 | 7 | 7 | 7 | 位7 |
56 | 8 | 8 | 8 | 8 | 数字8 |
57 | 9 | 9 | 9 | 9 | 数字9 |
58 | : | : | : | : | 结肠 |
59 | ; | ; | ; | ; | 分号 |
60 | < | < | < | < | 小于号 |
61 | = | = | = | = | 等号 |
62 | > | > | > | > | 大于号 |
63 | ? | ? | ? | ? | 问号 |
64 | @ | @ | @ | @ | 在商用 |
65 | A | A | A | A | 大写拉丁字母A |
66 | B | B | B | B | 拉丁大写字母B |
67 | C | C | C | C | 拉丁大写字母C |
68 | D | D | D | D | 拉丁大写字母D |
69 | E | E | E | E | 拉丁大写字母E |
70 | F | F | F | F | 拉丁大写字母F |
71 | G | G | G | G | 拉丁大写字母G |
72 | H | H | H | H | 拉丁大写字母H |
73 | I | I | I | I | 拉丁大写字母我 |
74 | J | J | J | J | 拉丁大写字母J |
75 | K | K | K | K | 拉丁大写字母K |
76 | L | L | L | L | 拉丁大写字母L |
77 | M | M | M | M | 拉丁大写字母M |
78 | N | N | N | N | 拉丁大写字母N |
79 | O | O | O | O | 拉丁大写字母O |
80 | P | P | P | P | 拉丁大写字母P |
81 | Q | Q | Q | Q | 拉丁大写字母Q |
82 | R | R | R | R | 拉丁大写字母R |
83 | S | S | S | S | 拉丁大写字母S |
84 | T | T | T | T | 拉丁大写字母T |
85 | U | U | U | U | 拉丁大写字母U |
86 | V | V | V | V | 拉丁大写字母V |
87 | W | W | W | W | 拉丁大写字母W |
88 | X | X | X | X | 拉丁大写字母X |
89 | Y | Y | Y | Y | 拉丁大写字母Y |
90 | Z | Z | Z | Z | 拉丁大写字母Z |
91 | [ | [ | [ | [ | 左方括号 |
92 | \ | \ | \ | \ | 反向固相线 |
93 | ] | ] | ] | ] | 右括号 |
94 | ^ | ^ | ^ | ^ | 抑扬音 |
95 | _ | _ | _ | _ | 低线 |
96 | ` | ` | ` | ` | 重音 |
97 | a | a | a | a | 拉丁文小写字母a |
98 | b | b | b | b | 拉丁小字母b |
99 | c | c | c | c | 拉丁小字母c |
100 | d | d | d | d | 拉丁小字母d |
101 | e | e | e | e | 拉丁小字母e |
102 | f | f | f | f | 拉丁小字母f |
103 | g | g | g | g | 拉丁小字母G |
104 | h | h | h | h | 拉丁小字母h |
105 | i | i | i | i | 拉丁小字母i |
106 | j | j | j | j | 拉丁小字母J |
107 | k | k | k | k | 拉丁小字母k |
108 | l | l | l | l | 拉丁小字母l |
109 | m | m | m | m | 拉丁小字母m |
110 | n | n | n | n | 拉丁小字母n |
111 | o | o | o | o | 拉丁文小写字母o |
112 | p | p | p | p | 拉丁小字母P |
113 | q | q | q | q | 拉丁小字母Q |
114 | r | r | r | r | 拉丁小字母R |
115 | s | s | s | s | 拉丁小字母s |
116 | t | t | t | t | 拉丁小字母T |
117 | u | u | u | u | 拉丁小字母u |
118 | v | v | v | v | 拉丁小字母v |
119 | w | w | w | w | 拉丁小字母w |
120 | x | x | x | x | 拉丁小字母x |
121 | y | y | y | y | 拉丁小字母Y |
122 | z | z | z | z | 拉丁小字母z |
123 | { | { | { | { | 左大括号 |
124 | | | | | | | | | 垂线 |
125 | } | } | } | } | 右花括号 |
126 | ~ | ~ | ~ | ~ | 波浪号 |
127 | DEL | ||||
128 | € | 欧元符号 | |||
129 | 不曾用过 | ||||
130 | ‚ | 单一的低9引号 | |||
131 | ƒ | 拉丁小字母f钩 | |||
132 | „ | 双低9引号 | |||
133 | … | 水平省略号 | |||
134 | † | 匕首 | |||
135 | ‡ | 双匕首 | |||
136 | ˆ | 修饰符字母抑扬音 | |||
137 | ‰ | 千分数符号 | |||
138 | Š | 拉丁大写字母S带抑扬 | |||
139 | ‹ | 单左尖引号 | |||
140 | Œ | 拉美资本结扎OE | |||
141 | 不曾用过 | ||||
142 | Z | 带抑扬拉丁大写字母Z | |||
143 | 不曾用过 | ||||
144 | 不曾用过 | ||||
145 | ‘ | 左单引号 | |||
146 | ’ | 右单引号 | |||
147 | “ | 左双引号 | |||
148 | ” | 右双引号 | |||
149 | • | 子弹 | |||
150 | – | 破折号 | |||
151 | — | 破折号 | |||
152 | ˜ | 小波浪 | |||
153 | ™ | 商标标志 | |||
154 | š | 拉丁小字母S带抑扬 | |||
155 | › | 单右尖引号 | |||
156 | œ | 拉丁小绷带OE | |||
157 | 不曾用过 | ||||
158 | z | 拉丁小字母Z带抑扬 | |||
159 | Ÿ | 拉丁大写字母Y及其二分法 | |||
160 | 无间断空间 | ||||
161 | 倒感叹号 | ||||
162 | ¢ | ¢ | ¢ | 百分号 | |
163 | £ | £ | £ | 英镑符号 | |
164 | 货币符号 | ||||
165 | ¥ | ¥ | ¥ | 日元符号 | |
166 | ¦ | ¦ | ¦ | 竖杠 | |
167 | § | § | § | 部分标志 | |
168 | ¨ | ¨ | ¨ | 二分法 | |
169 | © | © | © | 版权符号 | |
170 | ª | ª | ª | 女性顺序指示符 | |
171 | « | « | « | 左指双角引号 | |
172 | 不签 | ||||
173 | | | | 软连字符 | |
174 | ® | ® | ® | 注册标志 | |
175 | ¯ | ¯ | ¯ | 长音符号 | |
176 | ° | ° | ° | 度的标志 | |
177 | ± | ± | ± | 正负号 | |
178 | ² | ² | ² | 上标2 | |
179 | ³ | ³ | ³ | 上标3 | |
180 | 锐音符 | ||||
181 | µ | µ | µ | 微符号 | |
182 | 段落符号标志 | ||||
183 | · | · | · | 中间点 | |
184 | . | . | . | 变音符号 | |
185 | ª | ª | ª | 一个标 | |
186 | 阳刚顺序指示符 | ||||
187 | » | » | » | 右指向双角引号 | |
188 | 1/4 | 1/4 | 1/4 | 普通分数四分之一 | |
189 | 1/2 | 1/2 | 1/2 | 普通分数二分之一 | |
190 | 3/4 | 3/4 | 3/4 | 普通分数四分之三 | |
191 | 倒问号 | ||||
192 | À | À | À | 有严重的大写拉丁字母A | |
193 | Á | Á | Á | 急性大写拉丁字母A | |
194 | Â | Â | Â | 带抑扬的大写拉丁字母A | |
195 | Ã | Ã | Ã | 与波浪的大写拉丁字母A | |
196 | Ä | Ä | Ä | 用二分法的大写拉丁字母A | |
197 | Å | Å | Å | 以上环的大写拉丁字母A | |
198 | Æ | Æ | Æ | 大写拉丁字母AE | |
199 | C | C | C | 带下加符的拉丁大写字母C | |
200 | E | E | E | 拉丁大写字母e为严重 | |
201 | E | E | E | 拉美资本字母E急性 | |
202 | E | E | E | 拉美资本字母E带抑扬 | |
203 | E | E | E | 拉美资本字母E用二分法 | |
204 | I | I | I | 大写拉丁字母我的坟墓 | |
205 | I | I | I | 大写拉丁字母我急 | |
206 | I | I | I | 大写拉丁字母我带抑扬 | |
207 | I | I | I | 大写拉丁字母我二分法 | |
208 | Ð | Ð | Ð | 大写拉丁字母的Eth | |
209 | Ñ | Ñ | Ñ | 用波浪拉丁大写字母N | |
210 | O | O | O | 拉丁大写字母O与坟墓 | |
211 | O | O | O | 拉丁大写字母O急性 | |
212 | O | O | O | 拉丁大写字母O与抑扬 | |
213 | O | O | O | 拉丁大写字母O与波浪 | |
214 | O | O | O | 拉丁大写字母O与二分法 | |
215 | × | × | × | 乘号 | |
216 | Ø | Ø | Ø | 拉丁大写字母O与中风 | |
217 | U | U | U | 拉丁大写字母ü用严重 | |
218 | U | U | U | 拉丁大写字母ü急性 | |
219 | U | U | U | 拉丁大写字母ü用抑扬 | |
220 | U | U | U | 拉丁大写字母ü用二分法 | |
221 | Y | Y | Y | 拉美资本字母Y急性 | |
222 | Þ | Þ | Þ | 大写拉丁字母刺 | |
223 | ß | ß | ß | 小写拉丁字母声s | |
224 | a | a | a | 拉丁文小写字母a与坟墓 | |
225 | a | a | a | 拉丁文小写字母a急性 | |
226 | a | a | a | 拉丁文小写字母a与抑扬 | |
227 | a | a | a | 拉丁文小写字母a与波浪 | |
228 | a | a | a | 拉丁文小写字母a与二分法 | |
229 | a | a | a | 拉丁文小写字母a以上环 | |
230 | a | a | a | 小写拉丁字母AE | |
231 | c | c | c | 拉丁小字母c有变音符号 | |
232 | e | e | e | 拉丁小字母e与坟墓 | |
233 | e | e | e | 拉丁小字母e急性 | |
234 | e | e | e | 拉丁小字母e带抑扬 | |
235 | e | e | e | 拉丁小字母e与二分法 | |
236 | i | i | i | 拉丁小字母i与坟墓 | |
237 | i | i | i | 拉丁小字母i急性 | |
238 | i | i | i | 拉丁小字母i与抑扬 | |
239 | i | i | i | 拉丁小字母i与二分法 | |
240 | 小写拉丁字母ETH | ||||
241 | n | n | n | 拉丁小字母n与波浪 | |
242 | o | o | o | 拉丁文小写字母o与坟墓 | |
243 | o | o | o | 拉丁文小写字母o急性 | |
244 | o | o | o | 拉丁文小写字母o与抑扬 | |
245 | o | o | o | 拉丁文小写字母O与波浪 | |
246 | o | o | o | 拉丁文小写字母o用二分法 | |
247 | ÷ | ÷ | ÷ | 除号 | |
248 | 拉丁文小写字母o与中风 | ||||
249 | u | u | u | 拉丁小字母U与坟墓 | |
250 | u | u | u | 拉丁小字母U急性 | |
251 | u | u | u | 小写拉丁字母带抑扬 | |
252 | u | u | u | 拉丁小字母U用二分法 | |
253 | y | y | y | 拉丁小字母Y急性 | |
254 | þ | þ | þ | 小写拉丁字母刺 | |
255 | y | y | y | 拉丁小字母Y用二分法 |
ASCII字符集
ASCII使用从0到31的值(and 127)用于控制字符。
ASCII使用从32至126的值字母,数字和符号。
ASCII不使用值从128到255。
ANSI字符集(Windows-1252)
ANSI是相同的值ASCII从0到127。
ANSI具有用于从128到159的值的专有的字符集。
ANSI是相同的UTF-8为从160至255的值。
在ISO-8859-1字符集
8859-1是相同的值ASCII从0到127。
8859-1不使用的值从128到159。
8859-1是相同的UTF-8为从160至255的值。
在UTF-8字符集
UTF-8相同的值ASCII从0到127。
UTF-8不使用的值从128到159。
UTF-8是相同的ANSI和8859-1从160到255的值。
UTF-8从值256具有多于10点的不同的字符继续。
仔细看看,学习我们的完整的HTML字符集的参考 。