Последние учебники веб-разработки
×

HTML5 Руководство

HTML ГЛАВНАЯ HTML Введение HTML редакторы HTML базовый HTML элементы HTML Атрибуты HTML Заголовки HTML Пункты HTML Стили HTML форматирование HTML цитаты HTML Компьютерный код HTML Комментарии HTML Цвета HTML CSS HTML связи HTML Изображений HTML таблицы HTML Списки HTML Блок и строковые элементы HTML Классы HTML раскладка HTML отзывчивый HTML Iframes HTML JavaScript HTML Глава HTML юридические лица HTML Символы HTML Charset HTML URL шифровать HTML XHTML

HTML формы

HTML формы HTML Форма Элементы HTML Типы входных данных HTML Входные атрибуты

HTML5

HTML5 вступление HTML5 Поддержка HTML5 элементы HTML5 Семантика Миграция HTML5 HTML5 Гид по стилю

HTML Графика

HTML холст HTML SVG

HTML СМИ

HTML СМИ HTML видео HTML аудио HTML Плагины HTML YouTube

HTML APIs

HTML Geolocation HTML Перетаскивания HTML Локальное хранилище HTML App кэш HTML Web Workers HTML SSE

HTML Примеры

HTML Примеры HTML викторина HTML5 викторина HTML Резюме

HTML Рекомендации

HTML Список тегов HTML Атрибуты HTML События HTML холст HTML Аудио Видео HTML DOCTYPEs HTML Цвета HTML Наборы символов HTML URL шифровать HTML Языковые коды HTTP Сообщения HTTP методы PX to EM конвертер Горячие клавиши

HTML кодирование (наборы символов)


Для корректного отображения страницы HTML, веб - браузер должен знать набор символов (character encoding) для использования.


Что такое Кодировка символов?

ASCII , был первым стандартом кодирования символов (также называемый набором символов). Он определяет 127 различных буквенно-цифровых символов, которые могут быть использованы в Интернете.

HTML (Hypertext Markup Language) был в использовании с 1991 года, но HTML 4.0 (декабрь 1997) была первой стандартизированной версии, где международные символы были даны достаточно полный курс лечения. Когда HTML документ содержит специальные символы вне диапазона семь-битного ASCII две цели стоит учесть: целостность информации, и универсальный дисплей браузера.

ASCII поддерживаются цифры (0-9) , английские буквы (AZ) , а также некоторые специальные символы , такие как ! $ + - ( ) @ < > ! $ + - ( ) @ < > .

ANSI (Windows-1252) был оригинальный набор символов для Windows. Она поддерживает 256 различных кодов символов.

ISO-8859-1 был набор символов по умолчанию для HTML 4. Он также поддерживает 256 различных кодов символов.

Поскольку ANSI и ИСО были ограничены, кодировка символов по умолчанию была изменена на UTF-8 в HTML5.

UTF-8 (Unicode) охватывает практически все символы и символы в мире.

Все HTML 4 процессоры также поддерживают UTF-8.


HTML кодировка Атрибут

Для корректного отображения страницы HTML, веб-браузер должен знать набор символов, используемый в странице.

Это указывается в <meta> тег:

Для HTML4:

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

Для HTML5:

<meta charset="UTF-8">

Если браузер обнаруживает ISO-8859-1 на веб-странице, то он по умолчанию ANSI, потому что ANSI идентичен ISO-8859-1, за исключением, что ANSI имеет 32 дополнительных символов.


Различия между наборами символов

В приведенной ниже таблице показаны различия между наборами символов, описанных выше:

NumbASCIIANSI8859UTF-8 Описание
32     пространство
33!!!! восклицательный знак
34"""" кавычка
35#### знак номера
36$$$$ знак доллара
37%%%% знак процента
38&&&& амперсант
39'''' апостроф
40(((( левая скобка
41)))) правая скобка
42**** звездочка
43++++ знак плюс
44,,,, запятая
45---- дефис-минус
46.... полная остановка
47//// солидус
480000 цифра ноль
491111 цифра один
502222 цифра два
513333 цифра три
524444 цифра четыре
535555 цифра пять
546666 цифра шесть
557777 цифра семь
568888 цифра восемь
579999 цифра девять
58:::: двоеточие
59;;;; точка с запятой
60<<<< менее чем знак
61==== знак равенства
62>>>> знак больше
63???? вопросительный знак
64@@@@ коммерческая в
65AAAA Латинская заглавная буква
66BBBB Латинская заглавная буква B
67CCCC Латинская буква C
68DDDD Латинская буква D
69EEEE Латинская буква E
70FFFF Латинская буква F
71GGGG Латинская буква G
72HHHH Латинская буква H
73IIII Латинская заглавная буква I
74JJJJ Латинская буква J
75KKKK Латинская буква K
76LLLL Латинская буква L
77MMMM Латинская буква М
78NNNN Латинская буква N
79OOOO Латинская заглавная буква O
80PPPP Латинская буква P
81QQQQ Латинская заглавная буква Q
82RRRR Латинская заглавная буква R
83SSSS Латинская буква S
84TTTT Латинская заглавная буква T
85UUUU Латинская буква U
86VVVV Латинская заглавная буква V
87WWWW Латинская буква W
88XXXX Латинская буква X
89YYYY Латинская буква Y
90ZZZZ Латинская заглавная буква Z
91[[[[ левая квадратная скобка
92\\\\ обратный солидуса
93]]]] правая квадратная скобка
94^^^^ огибающая акцент
95____ низкая линия
96```` апостроф
97aaaa Латинская буква а
98bbbb Латинская буква Ь
99cccc Латинская буква с
100dddd Латинская буква d
101eeee Латинская буква е
102ffff Латинская буква е
103gggg Латинская буква г
104hhhh Латинская буква ч
105iiii Латинская буква я
106jjjj Латинская буква J
107kkkk Латинская буква к
108llll Латинская буква л
109mmmm Латинская буква м
110nnnn Латинская буква п
111oooo Латинская буква о
112pppp Латинская буква р
113qqqq Латинская буква д
114rrrr Латинская буква г
115ssss Латинская буква s
116tttt Латинская буква т
117uuuu Латинская буква U
118vvvv Латинская буква v
119wwww Латинская буква W
120xxxx Латинская буква х
121yyyy Латинская буква у
122zzzz Латинская буква г
123{{{{ левая фигурная скобка
124|||| вертикальная линия
125}}}} правая фигурная скобка
126~~~~ тильда
127DEL   
128    знак евро
129     НЕ ИСПОЛЬЗУЕТСЯ
130    сингл-9 с низкой кавычка
131 ƒ   Латинская буква е с крюком
132    двойная 9 с низкой кавычка
133    горизонтальное многоточие
134    кинжал
135    двойной крестик
136 ˆ   Модификатор письмо огибающая акцент
137    промилле знака
138 Š   Латинская заглавная буква S с кароном
139    Одинарная кавычка угол слева, указывающие
140 Œ   Latin лигатуры капитал О.Е.
141     НЕ ИСПОЛЬЗУЕТСЯ
142 Z   Латинская заглавная буква Z с кароном
143     НЕ ИСПОЛЬЗУЕТСЯ
144     НЕ ИСПОЛЬЗУЕТСЯ
145    левая одинарная кавычка
146    право одинарной кавычки
147    левый знак двойной цитаты
148    правая двойная кавычка
149    пуля
150    ан тира
151    тир
152 ˜   небольшой тильды
153    товарный знак знак
154 š   Латинская буква s с кароном
155    одной правой кнопкой указательного знака угла котировка
156 œ   Латинская лигатуры ае
157     НЕ ИСПОЛЬЗУЕТСЯ
158 z   Латинская буква г с кароном
159 Ÿ   Латинская буква Y с диэрезисом
160     нет разбития пространство
161     перевернутый восклицательный знак
162 ¢¢¢ цент знак
163 £££ знак фунта стерлингов
164     знак валюты
165 ¥¥¥ иен знак
166 ¦¦¦ сломанный бар
167 §§§ раздел знак
168 ¨¨¨ трема
169 ©©© знак авторского права
170 ªªª женственный порядковое индикатор
171 ««« слева указывая двойной угол кавычки
172     не подписывайте
173 ­­­ мягкий дефис
174 ®®® зарегистрированный знак
175 ¯¯¯ знак долготы над гласным
176 °°° степень знак
177 ±±± плюс-минус
178 ²²² надстрочный два
179 ³³³ надстрочный три
180     акут
181 µµµ микро знак
182     знак знак абзаца
183 ··· средняя точка
184 ... седиль
185 ªªª надстрочный один
186     мужской порядковое индикатор
187 »»» правая кнопка указывающей двойной угол кавычка
188 1/41/41/4 вульгарная фракция одна четверти
189 1/21/21/2 вульгарная фракция одна половины
190 3/43/43/4 вульгарная фракция три четверти
191     перевернутый вопросительный знак
192 ÀÀÀ Латинская заглавная буква А с могилой
193 ÁÁÁ Латинская заглавная буква А с острой
194 ÂÂÂ Латинская заглавная буква А с циркумфлексом
195 ÃÃÃ Латинская заглавная буква А с тильдой
196 ÄÄÄ Латинская заглавная буква А с диэрезисом
197 ÅÅÅ Латинская заглавная буква А с кольцом выше
198 ÆÆÆ Латинская буква AE
199 CCC Латинская заглавная буква C с седилем
200 EEE Латинская заглавная буква E с могилой
201 EEE Латинская заглавная буква E с острым
202 EEE Латинская заглавная буква E с циркумфлексом
203 EEE Латинская заглавная буква E с диэрезисом
204 III Латинская буква I с могилой
205 III Латинская буква I с острым
206 III Латинская буква I с циркумфлексом
207 III Латинская буква I с диэрезисом
208 ÐÐÐ Латинская буква Eth
209 ÑÑÑ Латинская заглавная буква N с тильдой
210 OOO Латинская заглавная буква O с могилой
211 OOO Латинская заглавная буква O с острым
212 OOO Латинская заглавная буква O с диакритическим
213 OOO Латинская заглавная буква O с тильдой
214 OOO Латинская заглавная буква O с диэрезисом
215 ××× знак умножения
216 ØØØ Латинская заглавная буква O с инсультом
217 UUU Латинская буква U с могилой
218 UUU Латинская буква U с острым
219 UUU Латинская буква U с диакритическим
220 UUU Латинская буква U с диэрезисом
221 YYY Латинская буква Y с острым
222 ÞÞÞ Latin Thorn заглавной буквы
223 ßßß Латинская буква s резком
224 aaa Латинская буква а с могилой
225 aaa Латинская буква а с острой
226 aaa Латинская буква а с циркумфлексом
227 aaa Латинская буква а с тильдой
228 aaa Латинская буква а с диэрезисом
229 aaa Латинская буква а с кольцом выше
230 aaa Латинская буква ае
231 ccc Латинская буква с с седилем
232 eee Латинская буква е с могилой
233 eee Латинская буква е с острой
234 eee Латинская буква е с циркумфлексом
235 eee Латинская буква е с диэрезисом
236 iii Латинская буква I с могилой
237 iii Латинская буква I с острым
238 iii Латинская буква I с циркумфлексом
239 iii Латинская буква I с диэрезисом
240     Латинская буква ETH
241 nnn Латинская буква п с тильдой
242 ooo Латинская буква о с могилой
243 ooo Латинская буква О с острым
244 ooo Латинская буква О с циркумфлексом
245 ooo Латинская буква O с тильдой
246 ooo Латинская буква О с диэрезисом
247 ÷÷÷ знак деления
248     Латинская буква О с инсультом
249 uuu Латинская буква U с могилой
250 uuu Латинская буква U с острым
251 uuu Латинская буква с диакритическим
252 uuu Латинская буква U с диэрезисом
253 yyy Латинская буква у с острой
254 þþþ Латинская буква шип
255 yyy Латинская буква у с диэрезисом

Набор символов ASCII

ASCII использует значения от 0 до 31 (and 127) для управляющих символов.

ASCII использует значение от 32 до 126 для букв, цифр и символов.

ASCII не использует значения от 128 до 255.


ANSI Набор символов (Windows-1252)

ANSI идентичен ASCII для значений от 0 до 127.

ANSI имеет собственный набор символов для значений от 128 до 159.

ANSI идентична UTF-8 для значений от 160 до 255.


ISO-8859-1 Набор символов

8859-1 идентичен ASCII для значений от 0 до 127.

8859-1 не использует значения от 128 до 159.

8859-1 идентична UTF-8 для значений от 160 до 255.


UTF-8, набор символов

UTF-8 идентичен ASCII для значений от 0 до 127.

UTF-8 не использует значения от 128 до 159.

UTF-8 является идентичным как ANSI и 8859-1 для значений от 160 до 255.

UTF-8, продолжается от значения 256 с более чем 10 000 различных символов.

Для более близкого взгляда, изучить наш полный HTML Character Set Reference .