Для корректного отображения страницы HTML, веб - браузер должен знать набор символов (character encoding) для использования.
Что такое Кодировка символов?
ASCII , был первым стандартом кодирования символов (также называемый набором символов). Он определяет 127 различных буквенно-цифровых символов, которые могут быть использованы в Интернете.
HTML (Hypertext Markup Language) был в использовании с 1991 года, но HTML 4.0 (декабрь 1997) была первой стандартизированной версии, где международные символы были даны достаточно полный курс лечения. Когда HTML документ содержит специальные символы вне диапазона семь-битного ASCII две цели стоит учесть: целостность информации, и универсальный дисплей браузера.
ASCII поддерживаются цифры (0-9) , английские буквы (AZ) , а также некоторые специальные символы , такие как ! $ + - ( ) @ < > ! $ + - ( ) @ < > .
ANSI (Windows-1252) был оригинальный набор символов для Windows. Она поддерживает 256 различных кодов символов.
ISO-8859-1 был набор символов по умолчанию для HTML 4. Он также поддерживает 256 различных кодов символов.
Поскольку ANSI и ИСО были ограничены, кодировка символов по умолчанию была изменена на UTF-8 в HTML5.
UTF-8 (Unicode) охватывает практически все символы и символы в мире.
Все HTML 4 процессоры также поддерживают UTF-8.
HTML кодировка Атрибут
Для корректного отображения страницы HTML, веб-браузер должен знать набор символов, используемый в странице.
Это указывается в <meta> тег:
Для HTML4:
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
Для HTML5:
<meta charset="UTF-8">
Если браузер обнаруживает ISO-8859-1 на веб-странице, то он по умолчанию ANSI, потому что ANSI идентичен ISO-8859-1, за исключением, что ANSI имеет 32 дополнительных символов.
Различия между наборами символов
В приведенной ниже таблице показаны различия между наборами символов, описанных выше:
Numb | ASCII | ANSI | 8859 | UTF-8 | Описание |
---|---|---|---|---|---|
32 | пространство | ||||
33 | ! | ! | ! | ! | восклицательный знак |
34 | " | " | " | " | кавычка |
35 | # | # | # | # | знак номера |
36 | $ | $ | $ | $ | знак доллара |
37 | % | % | % | % | знак процента |
38 | & | & | & | & | амперсант |
39 | ' | ' | ' | ' | апостроф |
40 | ( | ( | ( | ( | левая скобка |
41 | ) | ) | ) | ) | правая скобка |
42 | * | * | * | * | звездочка |
43 | + | + | + | + | знак плюс |
44 | , | , | , | , | запятая |
45 | - | - | - | - | дефис-минус |
46 | . | . | . | . | полная остановка |
47 | / | / | / | / | солидус |
48 | 0 | 0 | 0 | 0 | цифра ноль |
49 | 1 | 1 | 1 | 1 | цифра один |
50 | 2 | 2 | 2 | 2 | цифра два |
51 | 3 | 3 | 3 | 3 | цифра три |
52 | 4 | 4 | 4 | 4 | цифра четыре |
53 | 5 | 5 | 5 | 5 | цифра пять |
54 | 6 | 6 | 6 | 6 | цифра шесть |
55 | 7 | 7 | 7 | 7 | цифра семь |
56 | 8 | 8 | 8 | 8 | цифра восемь |
57 | 9 | 9 | 9 | 9 | цифра девять |
58 | : | : | : | : | двоеточие |
59 | ; | ; | ; | ; | точка с запятой |
60 | < | < | < | < | менее чем знак |
61 | = | = | = | = | знак равенства |
62 | > | > | > | > | знак больше |
63 | ? | ? | ? | ? | вопросительный знак |
64 | @ | @ | @ | @ | коммерческая в |
65 | A | A | A | A | Латинская заглавная буква |
66 | B | B | B | B | Латинская заглавная буква B |
67 | C | C | C | C | Латинская буква C |
68 | D | D | D | D | Латинская буква D |
69 | E | E | E | E | Латинская буква E |
70 | F | F | F | F | Латинская буква F |
71 | G | G | G | G | Латинская буква G |
72 | H | H | H | H | Латинская буква H |
73 | I | I | I | I | Латинская заглавная буква I |
74 | J | J | J | J | Латинская буква J |
75 | K | K | K | K | Латинская буква K |
76 | L | L | L | L | Латинская буква L |
77 | M | M | M | M | Латинская буква М |
78 | N | N | N | N | Латинская буква N |
79 | O | O | O | O | Латинская заглавная буква O |
80 | P | P | P | P | Латинская буква P |
81 | Q | Q | Q | Q | Латинская заглавная буква Q |
82 | R | R | R | R | Латинская заглавная буква R |
83 | S | S | S | S | Латинская буква S |
84 | T | T | T | T | Латинская заглавная буква T |
85 | U | U | U | U | Латинская буква U |
86 | V | V | V | V | Латинская заглавная буква V |
87 | W | W | W | W | Латинская буква W |
88 | X | X | X | X | Латинская буква X |
89 | Y | Y | Y | Y | Латинская буква Y |
90 | Z | Z | Z | Z | Латинская заглавная буква Z |
91 | [ | [ | [ | [ | левая квадратная скобка |
92 | \ | \ | \ | \ | обратный солидуса |
93 | ] | ] | ] | ] | правая квадратная скобка |
94 | ^ | ^ | ^ | ^ | огибающая акцент |
95 | _ | _ | _ | _ | низкая линия |
96 | ` | ` | ` | ` | апостроф |
97 | a | a | a | a | Латинская буква а |
98 | b | b | b | b | Латинская буква Ь |
99 | c | c | c | c | Латинская буква с |
100 | d | d | d | d | Латинская буква d |
101 | e | e | e | e | Латинская буква е |
102 | f | f | f | f | Латинская буква е |
103 | g | g | g | g | Латинская буква г |
104 | h | h | h | h | Латинская буква ч |
105 | i | i | i | i | Латинская буква я |
106 | j | j | j | j | Латинская буква J |
107 | k | k | k | k | Латинская буква к |
108 | l | l | l | l | Латинская буква л |
109 | m | m | m | m | Латинская буква м |
110 | n | n | n | n | Латинская буква п |
111 | o | o | o | o | Латинская буква о |
112 | p | p | p | p | Латинская буква р |
113 | q | q | q | q | Латинская буква д |
114 | r | r | r | r | Латинская буква г |
115 | s | s | s | s | Латинская буква s |
116 | t | t | t | t | Латинская буква т |
117 | u | u | u | u | Латинская буква U |
118 | v | v | v | v | Латинская буква v |
119 | w | w | w | w | Латинская буква W |
120 | x | x | x | x | Латинская буква х |
121 | y | y | y | y | Латинская буква у |
122 | z | z | z | z | Латинская буква г |
123 | { | { | { | { | левая фигурная скобка |
124 | | | | | | | | | вертикальная линия |
125 | } | } | } | } | правая фигурная скобка |
126 | ~ | ~ | ~ | ~ | тильда |
127 | DEL | ||||
128 | € | знак евро | |||
129 | НЕ ИСПОЛЬЗУЕТСЯ | ||||
130 | ‚ | сингл-9 с низкой кавычка | |||
131 | ƒ | Латинская буква е с крюком | |||
132 | „ | двойная 9 с низкой кавычка | |||
133 | … | горизонтальное многоточие | |||
134 | † | кинжал | |||
135 | ‡ | двойной крестик | |||
136 | ˆ | Модификатор письмо огибающая акцент | |||
137 | ‰ | промилле знака | |||
138 | Š | Латинская заглавная буква S с кароном | |||
139 | ‹ | Одинарная кавычка угол слева, указывающие | |||
140 | Œ | Latin лигатуры капитал О.Е. | |||
141 | НЕ ИСПОЛЬЗУЕТСЯ | ||||
142 | Z | Латинская заглавная буква Z с кароном | |||
143 | НЕ ИСПОЛЬЗУЕТСЯ | ||||
144 | НЕ ИСПОЛЬЗУЕТСЯ | ||||
145 | ‘ | левая одинарная кавычка | |||
146 | ’ | право одинарной кавычки | |||
147 | “ | левый знак двойной цитаты | |||
148 | ” | правая двойная кавычка | |||
149 | • | пуля | |||
150 | – | ан тира | |||
151 | — | тир | |||
152 | ˜ | небольшой тильды | |||
153 | ™ | товарный знак знак | |||
154 | š | Латинская буква s с кароном | |||
155 | › | одной правой кнопкой указательного знака угла котировка | |||
156 | œ | Латинская лигатуры ае | |||
157 | НЕ ИСПОЛЬЗУЕТСЯ | ||||
158 | z | Латинская буква г с кароном | |||
159 | Ÿ | Латинская буква Y с диэрезисом | |||
160 | нет разбития пространство | ||||
161 | перевернутый восклицательный знак | ||||
162 | ¢ | ¢ | ¢ | цент знак | |
163 | £ | £ | £ | знак фунта стерлингов | |
164 | знак валюты | ||||
165 | ¥ | ¥ | ¥ | иен знак | |
166 | ¦ | ¦ | ¦ | сломанный бар | |
167 | § | § | § | раздел знак | |
168 | ¨ | ¨ | ¨ | трема | |
169 | © | © | © | знак авторского права | |
170 | ª | ª | ª | женственный порядковое индикатор | |
171 | « | « | « | слева указывая двойной угол кавычки | |
172 | не подписывайте | ||||
173 | | | | мягкий дефис | |
174 | ® | ® | ® | зарегистрированный знак | |
175 | ¯ | ¯ | ¯ | знак долготы над гласным | |
176 | ° | ° | ° | степень знак | |
177 | ± | ± | ± | плюс-минус | |
178 | ² | ² | ² | надстрочный два | |
179 | ³ | ³ | ³ | надстрочный три | |
180 | акут | ||||
181 | µ | µ | µ | микро знак | |
182 | знак знак абзаца | ||||
183 | · | · | · | средняя точка | |
184 | . | . | . | седиль | |
185 | ª | ª | ª | надстрочный один | |
186 | мужской порядковое индикатор | ||||
187 | » | » | » | правая кнопка указывающей двойной угол кавычка | |
188 | 1/4 | 1/4 | 1/4 | вульгарная фракция одна четверти | |
189 | 1/2 | 1/2 | 1/2 | вульгарная фракция одна половины | |
190 | 3/4 | 3/4 | 3/4 | вульгарная фракция три четверти | |
191 | перевернутый вопросительный знак | ||||
192 | À | À | À | Латинская заглавная буква А с могилой | |
193 | Á | Á | Á | Латинская заглавная буква А с острой | |
194 | Â | Â | Â | Латинская заглавная буква А с циркумфлексом | |
195 | Ã | Ã | Ã | Латинская заглавная буква А с тильдой | |
196 | Ä | Ä | Ä | Латинская заглавная буква А с диэрезисом | |
197 | Å | Å | Å | Латинская заглавная буква А с кольцом выше | |
198 | Æ | Æ | Æ | Латинская буква AE | |
199 | C | C | C | Латинская заглавная буква C с седилем | |
200 | E | E | E | Латинская заглавная буква E с могилой | |
201 | E | E | E | Латинская заглавная буква E с острым | |
202 | E | E | E | Латинская заглавная буква E с циркумфлексом | |
203 | E | E | E | Латинская заглавная буква E с диэрезисом | |
204 | I | I | I | Латинская буква I с могилой | |
205 | I | I | I | Латинская буква I с острым | |
206 | I | I | I | Латинская буква I с циркумфлексом | |
207 | I | I | I | Латинская буква I с диэрезисом | |
208 | Ð | Ð | Ð | Латинская буква Eth | |
209 | Ñ | Ñ | Ñ | Латинская заглавная буква N с тильдой | |
210 | O | O | O | Латинская заглавная буква O с могилой | |
211 | O | O | O | Латинская заглавная буква O с острым | |
212 | O | O | O | Латинская заглавная буква O с диакритическим | |
213 | O | O | O | Латинская заглавная буква O с тильдой | |
214 | O | O | O | Латинская заглавная буква O с диэрезисом | |
215 | × | × | × | знак умножения | |
216 | Ø | Ø | Ø | Латинская заглавная буква O с инсультом | |
217 | U | U | U | Латинская буква U с могилой | |
218 | U | U | U | Латинская буква U с острым | |
219 | U | U | U | Латинская буква U с диакритическим | |
220 | U | U | U | Латинская буква U с диэрезисом | |
221 | Y | Y | Y | Латинская буква Y с острым | |
222 | Þ | Þ | Þ | Latin Thorn заглавной буквы | |
223 | ß | ß | ß | Латинская буква s резком | |
224 | a | a | a | Латинская буква а с могилой | |
225 | a | a | a | Латинская буква а с острой | |
226 | a | a | a | Латинская буква а с циркумфлексом | |
227 | a | a | a | Латинская буква а с тильдой | |
228 | a | a | a | Латинская буква а с диэрезисом | |
229 | a | a | a | Латинская буква а с кольцом выше | |
230 | a | a | a | Латинская буква ае | |
231 | c | c | c | Латинская буква с с седилем | |
232 | e | e | e | Латинская буква е с могилой | |
233 | e | e | e | Латинская буква е с острой | |
234 | e | e | e | Латинская буква е с циркумфлексом | |
235 | e | e | e | Латинская буква е с диэрезисом | |
236 | i | i | i | Латинская буква I с могилой | |
237 | i | i | i | Латинская буква I с острым | |
238 | i | i | i | Латинская буква I с циркумфлексом | |
239 | i | i | i | Латинская буква I с диэрезисом | |
240 | Латинская буква ETH | ||||
241 | n | n | n | Латинская буква п с тильдой | |
242 | o | o | o | Латинская буква о с могилой | |
243 | o | o | o | Латинская буква О с острым | |
244 | o | o | o | Латинская буква О с циркумфлексом | |
245 | o | o | o | Латинская буква O с тильдой | |
246 | o | o | o | Латинская буква О с диэрезисом | |
247 | ÷ | ÷ | ÷ | знак деления | |
248 | Латинская буква О с инсультом | ||||
249 | u | u | u | Латинская буква U с могилой | |
250 | u | u | u | Латинская буква U с острым | |
251 | u | u | u | Латинская буква с диакритическим | |
252 | u | u | u | Латинская буква U с диэрезисом | |
253 | y | y | y | Латинская буква у с острой | |
254 | þ | þ | þ | Латинская буква шип | |
255 | y | y | y | Латинская буква у с диэрезисом |
Набор символов ASCII
ASCII использует значения от 0 до 31 (and 127) для управляющих символов.
ASCII использует значение от 32 до 126 для букв, цифр и символов.
ASCII не использует значения от 128 до 255.
ANSI Набор символов (Windows-1252)
ANSI идентичен ASCII для значений от 0 до 127.
ANSI имеет собственный набор символов для значений от 128 до 159.
ANSI идентична UTF-8 для значений от 160 до 255.
ISO-8859-1 Набор символов
8859-1 идентичен ASCII для значений от 0 до 127.
8859-1 не использует значения от 128 до 159.
8859-1 идентична UTF-8 для значений от 160 до 255.
UTF-8, набор символов
UTF-8 идентичен ASCII для значений от 0 до 127.
UTF-8 не использует значения от 128 до 159.
UTF-8 является идентичным как ANSI и 8859-1 для значений от 160 до 255.
UTF-8, продолжается от значения 256 с более чем 10 000 различных символов.
Для более близкого взгляда, изучить наш полный HTML Character Set Reference .