Aby poprawnie wyświetlić stronę HTML, przeglądarka musi znać zestawu znaków (character encoding) do wykorzystania.
Co to jest kodowanie znaków?
ASCII był pierwszy standard kodowania znaków (zwany także zestaw znaków). Definiuje ona 127 różnych znaków alfanumerycznych, które mogą być używane w Internecie.
HTML (Hypertext Markup Language) został w użyciu od 1991 roku, ale HTML 4.0 (grudzień 1997) był pierwszym standaryzowany wersja gdzie znaki międzynarodowe dano kompletną obróbkę. Gdy dokument HTML zawiera znaków specjalnych poza zasięgiem siedem-bitowym ASCII dwa cele są warte rozważenia: integralność informacyjną, a wyświetlacz przeglądarka uniwersalne.
Numery ASCII obsługiwane (0-9) , angielskie litery (AZ) , a niektóre znaki specjalne, takie jak ! $ + - ( ) @ < > ! $ + - ( ) @ < > .
ANSI (Windows-1252) był oryginalny zestaw znaków systemu Windows. Jest obsługiwana 256 różnych kodów znakowych.
ISO-8859-1 był domyślny zestaw znaków dla HTML 4. obsługiwane również 256 różnych kodów znakowych.
Ponieważ ANSI i ISO były ograniczone, domyślne kodowanie znaków został zmieniony na UTF-8 w HTML5.
UTF-8 (Unicode) obejmuje prawie wszystkie znaki i symbole na świecie.
Wszystkie 4 procesory HTML również obsługiwać UTF-8.
HTML charset Atrybut
Aby poprawnie wyświetlić stronę HTML, przeglądarka musi znać zestaw znaków używanych na stronie.
To jest określona w <meta> tag:
Dla HTML4:
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
HTML5:
<meta charset="UTF-8">
Jeśli przeglądarka wykryje ISO-8859-1 na stronie internetowej, to domyślnie ANSI, ponieważ ANSI jest identyczny z ISO-8859-1 z wyjątkiem, że ANSI posiada 32 dodatkowych znaków.
Różnice między zestawami znaków
Poniższa tabela pokazuje różnice pomiędzy zestawami znaków opisanych powyżej:
Numb | ASCII | ANSI | 8859 | UTF-8 | Opis |
---|---|---|---|---|---|
32 | przestrzeń | ||||
33 | ! | ! | ! | ! | wykrzyknik |
34 | " | " | " | " | cudzysłów |
35 | # | # | # | # | Numer znak |
36 | $ | $ | $ | $ | znak dolara |
37 | % | % | % | % | znak procent |
38 | & | & | & | & | ampersand |
39 | ' | ' | ' | ' | apostrof |
40 | ( | ( | ( | ( | lewy nawias |
41 | ) | ) | ) | ) | prawy nawias |
42 | * | * | * | * | gwiazdka |
43 | + | + | + | + | znak plus |
44 | , | , | , | , | przecinek |
45 | - | - | - | - | łącznik-minus |
46 | . | . | . | . | kropka |
47 | / | / | / | / | solidus |
48 | 0 | 0 | 0 | 0 | cyfry zero |
49 | 1 | 1 | 1 | 1 | jedna cyfra |
50 | 2 | 2 | 2 | 2 | cyfra dwa |
51 | 3 | 3 | 3 | 3 | cyfra trzy |
52 | 4 | 4 | 4 | 4 | cyfra cztery |
53 | 5 | 5 | 5 | 5 | cyfra pięć |
54 | 6 | 6 | 6 | 6 | cyfra sześć |
55 | 7 | 7 | 7 | 7 | cyfra siedem |
56 | 8 | 8 | 8 | 8 | cyfra osiem |
57 | 9 | 9 | 9 | 9 | cyfra dziewięć |
58 | : | : | : | : | dwukropek |
59 | ; | ; | ; | ; | średnik |
60 | < | < | < | < | mniej niż znak |
61 | = | = | = | = | znak równości |
62 | > | > | > | > | większy niż znak |
63 | ? | ? | ? | ? | znak zapytania |
64 | @ | @ | @ | @ | commercial |
65 | A | A | A | A | Łacińska wielka litera A |
66 | B | B | B | B | Łacińska wielka litera B |
67 | C | C | C | C | Łacińska wielka litera C |
68 | D | D | D | D | Łacińska wielka litera D |
69 | E | E | E | E | Łacińska wielka litera E |
70 | F | F | F | F | Łacińska wielka litera F |
71 | G | G | G | G | Łacińska wielka litera G |
72 | H | H | H | H | Łacińska wielka litera H |
73 | I | I | I | I | Łacińska wielka litera ja |
74 | J | J | J | J | Łacińska wielka litera J |
75 | K | K | K | K | Łacińska wielka litera K |
76 | L | L | L | L | Łacińska wielka litera L |
77 | M | M | M | M | Łacińska wielka litera M |
78 | N | N | N | N | Łacińska wielka litera N |
79 | O | O | O | O | Łacińska wielka litera O |
80 | P | P | P | P | Łacińska wielka litera P |
81 | Q | Q | Q | Q | Łacińska wielka litera P |
82 | R | R | R | R | Łacińska wielka litera R |
83 | S | S | S | S | Łacińska wielka litera S |
84 | T | T | T | T | Łacińska wielka litera T |
85 | U | U | U | U | Łacińska wielka litera U |
86 | V | V | V | V | Łacińska wielka litera V |
87 | W | W | W | W | Łacińska wielka litera W |
88 | X | X | X | X | Łacińska wielka litera X |
89 | Y | Y | Y | Y | Łacińska wielka litera Y |
90 | Z | Z | Z | Z | Łacińska wielka litera Z |
91 | [ | [ | [ | [ | lewy nawias kwadratowy |
92 | \ | \ | \ | \ | odwrotna solidusu |
93 | ] | ] | ] | ] | prawy nawias kwadratowy |
94 | ^ | ^ | ^ | ^ | okalającej akcent |
95 | _ | _ | _ | _ | niska linia |
96 | ` | ` | ` | ` | grave accent |
97 | a | a | a | a | Łacińska mała litera a |
98 | b | b | b | b | Łacińska mała litera b |
99 | c | c | c | c | Łacińska mała litera c |
100 | d | d | d | d | Łacińska mała litera d |
101 | e | e | e | e | Łacińska mała litera e |
102 | f | f | f | f | Łacińska mała litera f |
103 | g | g | g | g | Łacińska mała litera g |
104 | h | h | h | h | Łacińska mała litera h |
105 | i | i | i | i | Łacińska mała litera i |
106 | j | j | j | j | Łacińska mała litera j |
107 | k | k | k | k | Łacińska mała litera k |
108 | l | l | l | l | Łacińska mała litera l |
109 | m | m | m | m | Łacińska mała litera m |
110 | n | n | n | n | Łacińska mała litera n |
111 | o | o | o | o | Łacińska mała litera O |
112 | p | p | p | p | Łacińska mała litera p |
113 | q | q | q | q | Łacińska mała litera q |
114 | r | r | r | r | Łacińska mała litera R |
115 | s | s | s | s | Łacińska mała litera s |
116 | t | t | t | t | Łacińska mała litera t |
117 | u | u | u | u | Łacińska mała litera u |
118 | v | v | v | v | Łacińska mała litera v |
119 | w | w | w | w | Łacińska mała litera w |
120 | x | x | x | x | Łacińska mała litera x |
121 | y | y | y | y | Łacińska mała litera y |
122 | z | z | z | z | Łacińska mała litera oo |
123 | { | { | { | { | lewy nawias klamrowy |
124 | | | | | | | | | pionowa linia |
125 | } | } | } | } | prawy nawias klamrowy |
126 | ~ | ~ | ~ | ~ | tylda |
127 | DEL | ||||
128 | € | znak euro | |||
129 | NIEUŻYWANY | ||||
130 | ‚ | single niskiej 9 cudzysłów | |||
131 | ƒ | Łacińska mała litera f z hakiem | |||
132 | „ | podwójnie niskiego 9 cudzysłów | |||
133 | … | pozioma elipsa | |||
134 | † | sztylet | |||
135 | ‡ | podwójne sztylet | |||
136 | ˆ | modyfikator list daszkiem akcent | |||
137 | ‰ | promila znak | |||
138 | Š | Łacińska wielka litera S z Caron | |||
139 | ‹ | Pojedynczy cudzysłów lewy wskazując kąt | |||
140 | Œ | Łacińska podwiązanie kapitał OE | |||
141 | NIEUŻYWANY | ||||
142 | Z | Łacińska wielka litera Z z Caron | |||
143 | NIEUŻYWANY | ||||
144 | NIEUŻYWANY | ||||
145 | ‘ | lewy pojedynczy cudzysłów | |||
146 | ’ | prawo pojedynczy cudzysłów | |||
147 | “ | lewy podwójny cudzysłów | |||
148 | ” | prawo podwójny cudzysłów | |||
149 | • | kula | |||
150 | – | półpauza | |||
151 | — | em kreska | |||
152 | ˜ | mały tyldy | |||
153 | ™ | znak towarowy znak | |||
154 | š | Łacińska mała litera sz Caron | |||
155 | › | Pojedynczy prawym wskazującym kąt cudzysłów | |||
156 | œ | Łacińska mała podwiązanie oe | |||
157 | NIEUŻYWANY | ||||
158 | z | Łacińska mała litera oo z Caron | |||
159 | Ÿ | Łacińska wielka litera Y z diaeresis | |||
160 | no-przerwa przestrzeń | ||||
161 | odwrócony wykrzyknik | ||||
162 | ¢ | ¢ | ¢ | cent znak | |
163 | £ | £ | £ | znak funta | |
164 | znak waluty | ||||
165 | ¥ | ¥ | ¥ | jen znak | |
166 | ¦ | ¦ | ¦ | złamany bar | |
167 | § | § | § | paragraf | |
168 | ¨ | ¨ | ¨ | diaeresis | |
169 | © | © | © | znak copyright | |
170 | ª | ª | ª | kobiece wskaźnik porządkowa | |
171 | « | « | « | podwójna strzałka w lewo kąt cudzysłów | |
172 | nie podpisuj | ||||
173 | | | | miękki łącznik | |
174 | ® | ® | ® | zarejestrowanym znakiem | |
175 | ¯ | ¯ | ¯ | Macron | |
176 | ° | ° | ° | stopień znak | |
177 | ± | ± | ± | plus minus | |
178 | ² | ² | ² | górny dwa | |
179 | ³ | ³ | ³ | górny trzy | |
180 | Ostra nacisk | ||||
181 | µ | µ | µ | mikro znak | |
182 | pilcrow znak | ||||
183 | · | · | · | środkowa kropka | |
184 | . | . | . | cedilla | |
185 | ª | ª | ª | górny jeden | |
186 | męski wskaźnik porządkowa | ||||
187 | » | » | » | podwójna strzałka w prawo kąt cudzysłów | |
188 | 1/4 | 1/4 | 1/4 | wulgarnych jedna czwarta frakcja | |
189 | 1/2 | 1/2 | 1/2 | wulgarnych część pół | |
190 | 3/4 | 3/4 | 3/4 | wulgarnych frakcja trzy czwarte | |
191 | odwrócony znak zapytania | ||||
192 | À | À | À | Łacińska wielka litera A z grobu | |
193 | Á | Á | Á | Łacińska wielka litera A z ostrą | |
194 | Â | Â | Â | Łacińska wielka litera A z daszkiem | |
195 | Ã | Ã | Ã | Łacińska wielka litera A z tyldą | |
196 | Ä | Ä | Ä | Łacińska wielka litera A o diaeresis | |
197 | Å | Å | Å | Łacińska wielka litera A z pierścieniem powyżej | |
198 | Æ | Æ | Æ | Łacińska wielka litera AE | |
199 | C | C | C | Łacińska wielka litera C z haczykiem | |
200 | E | E | E | Łacińska wielka litera E z grobu | |
201 | E | E | E | Łacińska wielka litera E z ostrą | |
202 | E | E | E | Łacińska wielka litera E z daszkiem | |
203 | E | E | E | Łacińska wielka litera E z diaeresis | |
204 | I | I | I | Łacińska wielka litera I z grobu | |
205 | I | I | I | Łacińska wielka litera I z ostrą | |
206 | I | I | I | Łacińska wielka litera I z daszkiem | |
207 | I | I | I | Łacińska wielka litera I z diaeresis | |
208 | Ð | Ð | Ð | Łacińska wielka litera Eth | |
209 | Ñ | Ñ | Ñ | Łacińska wielka litera N z tyldą | |
210 | O | O | O | Łacińska wielka litera O z grobu | |
211 | O | O | O | Łacińska wielka litera O z ostrą | |
212 | O | O | O | Łacińska wielka litera O z daszkiem | |
213 | O | O | O | Łacińska wielka litera O z tyldą | |
214 | O | O | O | Łacińska wielka litera O z diaeresis | |
215 | × | × | × | znak mnożenia | |
216 | Ø | Ø | Ø | Łacińska wielka litera O z udarem | |
217 | U | U | U | Łacińska wielka litera U z grobu | |
218 | U | U | U | Łacińska wielka litera U z ostrą | |
219 | U | U | U | Łacińska wielka litera U z daszkiem | |
220 | U | U | U | Łacińska wielka litera U z diaeresis | |
221 | Y | Y | Y | Łacińska wielka litera Y z ostrą | |
222 | Þ | Þ | Þ | Łacińska wielka litera Thorn | |
223 | ß | ß | ß | Łacińska mała litera s ostry | |
224 | a | a | a | Łacińska mała litera a z grobu | |
225 | a | a | a | Łacińska mała litera a z ostrą | |
226 | a | a | a | Łacińska mała litera a z daszkiem | |
227 | a | a | a | Łacińska mała litera a z tyldą | |
228 | a | a | a | Łacińska mała litera a z diaeresis | |
229 | a | a | a | Łacińska mała litera a pierścieniem powyżej | |
230 | a | a | a | Łacińska mała litera ae | |
231 | c | c | c | Łacińska mała litera c z haczykiem | |
232 | e | e | e | Łacińska mała litera E z grobu | |
233 | e | e | e | Łacińska mała litera E z ostrą | |
234 | e | e | e | Łacińska mała litera E z daszkiem | |
235 | e | e | e | Łacińska mała litera E z diaeresis | |
236 | i | i | i | Łacińska mała litera I z grobu | |
237 | i | i | i | Łacińska mała litera I z ostrą | |
238 | i | i | i | Łacińska mała litera I z daszkiem | |
239 | i | i | i | Łacińska mała litera I z diaeresis | |
240 | Łacińska mała litera ETH | ||||
241 | n | n | n | Łacińska mała litera nz tyldą | |
242 | o | o | o | Łacińska mała litera O z grobu | |
243 | o | o | o | Łacińska mała litera O z ostrą | |
244 | o | o | o | Łacińska mała litera O z daszkiem | |
245 | o | o | o | Łacińska mała litera O z tyldą | |
246 | o | o | o | Łacińska mała litera O z diaeresis | |
247 | ÷ | ÷ | ÷ | podział znak | |
248 | Łacińska mała litera O z udarem | ||||
249 | u | u | u | Łacińska mała litera uz grobu | |
250 | u | u | u | Łacińska mała litera uz ostra | |
251 | u | u | u | Łacińska mała litera z daszkiem | |
252 | u | u | u | Łacińska mała litera uz diaeresis | |
253 | y | y | y | Łacińska mała litera y z ostrą | |
254 | þ | þ | þ | Łacińska mała litera cierń | |
255 | y | y | y | Łacińska mała litera y z diaeresis |
Set ASCII znaków
ASCII używa wartości od 0 do 31 (and 127) dla znaków kontrolnych.
ASCII używa wartości od 32 do 126 z liter, cyfr i symboli.
ASCII nie używać wartości od 128 do 255.
ANSI zestaw znaków (Windows-1252)
ANSI jest identyczna ASCII dla wartości od 0 do 127.
ANSI ma opatentowany zestaw znaków dla wartości od 128 do 159.
ANSI identyczne UTF-8 do wartości od 160 do 255.
ISO-8859-1 Zestaw znaków
8859-1 jest identyczna ASCII dla wartości od 0 do 127.
8859-1 nie używać wartości od 128 do 159.
8859-1 są identyczne UTF-8 wartości od 160 do 255.
Set UTF-8 znaków
UTF-8 jest identyczna ASCII dla wartości od 0 do 127.
UTF-8 nie używać wartości od 128 do 159.
UTF-8 jest identyczne zarówno ANSI i 8859-1 o wartości od 160 do 255.
UTF-8 trwa od wartości 256 z ponad 10 000 różnych znaków.
Dla bliższego spojrzenia, zapoznania się z naszą Kompletna HTML postaci zadanej .