Aby poprawnie wyświetlić stronę HTML, przeglądarka musi wiedzieć, co zestaw znaków (kodowanie) do użycia.
HTML Zestawy znaków
Co to jest poprawne kodowanie znaków do wykorzystania w HTML?
Dla HTML5, domyślne kodowanie znaków UTF-8.
Nie zawsze tak było. Kodowanie znaków dla wczesnej internecie był ASCII.
Później, z HTML 2.0 z HTML 4.01, ISO-8859-1 został uznany za standard.
Z XML i HTML5, UTF-8 w końcu dotarł i rozwiązać wiele problemów kodowania znaków.
Poniżej znajduje się krótki opis standardów kodowania znaków.
Na początku: ASCII
informacje o komputerze (numery, teksty i zdjęcia) jest przechowywana jako binarne zer i jedynek (01000101) w elektronice.
Aby ujednolicić przechowywanie znaków alfanumerycznych, American Standard Code dla Wymiany Informacji (ASCII) został utworzony. Jest zdefiniowana unikalny binarny numer 7-bitów dla każdego znaku chowanym wspierać cyfr od 0-9, górna / dolna przypadku alfabetu angielskiego (az, AZ), a niektóre znaki specjalne, takie jak! + $ - () @ <>.
Od ASCII użyty jeden bajt (7 bitów dla charakteru i jeden bit parzystości dla kontroli transmisji), może to stanowić jedynie 128 różnych znaków. Ponadto 32 z tych znaków były zarezerwowane dla innych celów kontrolnych.
Największą słabością z ASCII było to, że wykluczone niż angielskich liter.
ASCII jest nadal w powszechnym użyciu, zwłaszcza w dużych komputerach, systemach mainframe.
Dla bliższego spojrzenia, prosimy o zapoznania się z naszą Kompletna ASCII Reference .
W systemie Windows: ANSI
ANSI (zwany również Windows 1252) był domyślny zestaw znaków w systemie Windows, do Windows 95.
ANSI jest rozszerzeniem ASCII, z dodatkiem znaków międzynarodowych. Używa pełny bajt (8 bitów) do reprezentowania 256 różnych znaków.
Ponieważ ANSI jest domyślny zestaw znaków w Windows, to jest obsługiwane przez wszystkie przeglądarki.
Dla bliższego spojrzenia, prosimy o zapoznania się z naszą Kompletna ANSI Reference .
W HTML 4: ISO-8859-1
Ponieważ większość krajów używać znaków spoza ASCII, domyślne kodowanie znaków w standardzie HTML 2.0 została zmieniona na ISO-8859-1.
ISO-8859-1 jest rozszerzeniem ASCII, z dodatkiem znaków międzynarodowych. Podobnie jak ANSI, używa pełny bajt reprezentuje dwa razy więcej znaków niż ASCII.
Gdy przeglądarka wykryje ISO-8859-1 na stronie internetowej, zazwyczaj domyślnie ANSI, ponieważ ANSI jest identyczny z ISO-8859-1, z wyjątkiem, że ANSI posiada 32 dodatkowych znaków. |
Jeżeli HTML 4 strona używa innego zestawu znaków niż ISO-8859-1, powinien być określony w <meta> tag:
Domyślnym zestawem znaków HTML5 jest UTF-8. |
Dla bliższego spojrzenia, prosimy o zapoznania się z naszą Kompletna ISO-8859-1 Reference .
W HTML5: Unicode UTF-8
Ponieważ zestawy znaków wymienione powyżej są ograniczone i nie jest kompatybilny w środowiskach wielojęzycznych Konsorcjum Unicode opracowany standard Unicode.
Pokrywy Standardowe Unicode (prawie) wszystkie znaki, znaki przestankowe i symbole świata.
Unicode umożliwia przetwarzanie, przechowywanie i transport tekstu, niezależnie od platformy i języka.
Domyślne kodowanie znaków w HTML5 jest UTF-8.
Dla bliższego spojrzenia, prosimy o zapoznania się z naszą Kompletna Reference Unicode .