Для корректного отображения страницы HTML, браузер должен знать, какой набор символов (кодировка символов) для использования.
HTML наборы символов
Что такое правильный кодировки символов для использования в HTML?
Для HTML5, кодировка символов по умолчанию является UTF-8.
Это не всегда было так. Кодировка символов для раннего веб был ASCII.
Позже, из HTML 2.0 для HTML 4.01, ISO-8859-1 считается стандартом.
С помощью XML и HTML5, UTF-8, наконец, прибыл, и решить множество проблем кодирования символов.
Ниже приводится краткое описание стандартов кодировки символов.
В начале: ASCII
Компьютерная информация (номера, тексты и рисунки) хранится в виде двоичных единиц и нулей (01000101) в электронике.
Для того, чтобы стандартизировать хранение буквенно-цифровых символов, был создан Американский стандартный код для обмена информацией (ASCII). Он определил уникальный двоичный 7-битное число для каждого хранимого характера для поддержки цифры от 0-9, верхний / нижний регистр буквы английского алфавита (AZ, AZ), а также некоторые специальные символы, такие как! $ + - () @ <>.
Поскольку ASCII используется один байт (7 битов для символа, а также один из бит для контроля четности передачи), она может представлять только 128 различных символов. Кроме того 32 из этих символов были зарезервированы для других целей управления.
Самая большая слабость с ASCII было то, что она исключала не являющимся английскими буквами.
ASCII все еще широко используются сегодня, особенно в больших ЭВМ компьютерных систем.
Для более близкого взгляда, пожалуйста , изучить наш Complete Reference ASCII .
В операционной системе Windows: ANSI
ANSI (также называемый Windows-1252) был набор символов по умолчанию в Windows, вплоть до Windows 95.
ANSI является расширением ASCII, с добавлением международных символов. Он использует полный байт (8-бит) для представления 256 различных символов.
Так как ANSI был набор символов по умолчанию в Windows, он поддерживается всеми браузерами.
Для более близкого взгляда, пожалуйста , изучить наш полный ANSI Reference .
В HTML 4: ISO-8859-1
Поскольку большинство стран используют символы вне ASCII, кодировка символов по умолчанию в стандарте HTML 2.0 был изменен на ISO-8859-1.
ISO-8859-1 является расширением ASCII, с добавлением международных символов. Как ANSI, он использует полный байт для представления в два раза больше символов, чем ASCII.
Когда браузеры обнаружить ISO-8859-1 на веб-странице, они обычно по умолчанию ANSI, потому что ANSI идентичен ISO-8859-1, за исключением, что ANSI имеет 32 дополнительных символов. |
Если веб - страница HTML 4 использует другой символьный набор , чем ISO-8859-1, он должен быть указан в <meta> тег:
Набором символов по умолчанию для HTML5 является UTF-8. |
Для более близкого взгляда, пожалуйста , изучить наш полный ISO-8859-1 Reference .
В HTML5: Unicode UTF-8
Поскольку наборы символов, перечисленные выше, ограничены, и не совместимы в многоязычной среде, Консорциум Unicode разработал стандарт Unicode.
В Unicode Стандартные крышки (почти) все символы, знаки препинания и символы в мире.
Unicode позволяет обрабатывать, хранение и транспортировка текста, независимо от платформы и языка.
Кодировка символов по умолчанию в HTML5 является UTF-8.
Для более близкого взгляда, пожалуйста , изучить наш Complete Reference Unicode .