Ultimele tutoriale de dezvoltare web

HTML Encoding (seturi de caractere)


Pentru a afișa corect o pagină HTML, un browser web trebuie să cunoască setul de caractere (character encoding) de (character encoding) a (character encoding) pentru a utiliza.


Ce este Codificare caractere?

ASCII a fost primul standard de codificare a caracterelor (numit , de asemenea , setul de caractere). Acesta definește 127 de caractere alfanumerice diferite, care ar putea fi utilizate pe internet.

Numerele ASCII sprijinit (0-9) , litere englezești (AZ) , și unele caractere speciale , cum ar fi ! $ + - ( ) @ < > ! $ + - ( ) @ < > .

ANSI (Windows-1252) a fost original , setul de caractere pentru Windows. Acesta a sprijinit 256 de coduri de caractere diferite.

ISO-8859-1 a fost caracterul setat implicit pentru HTML 4. De asemenea, a sprijinit 256 de coduri de caractere diferite.

Deoarece ANSI și ISO au fost limitate, codificarea caracterelor implicită a fost schimbat la UTF-8 în HTML5.

UTF-8 (Unicode) acoperă aproape toate caracterele și simbolurile din lume.

Toate HTML 4 procesoare suporta de asemenea UTF-8.


HTML charset Atributul

Pentru a afișa corect o pagină HTML, un browser web trebuie să cunoască setul de caractere utilizat în pagina.

Acest lucru este specificat în <meta> tag - ul:

Pentru HTML4:

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

Pentru HTML5:

<meta charset="UTF-8">

În cazul în care un browser detectează ISO-8859-1 într-o pagină web, acesta implicit la ANSI, deoarece ANSI este identic cu ISO-8859-1 cu excepția faptului că ANSI are 32 de caractere suplimentare.


Diferențe între seturi de caractere

Tabelul de mai jos prezintă diferențele dintre seturile de caractere descrise mai sus:

NumbASCIIANSI8859UTF-8 Descriere
32 spaţiu
33!!!! Semnul exclamarii
34"""" Ghilimele
35#### semn numărul
36$$$$ semnul dolarului
37%%%% semn la sută
38&&&& ampersand
39'''' apostrof
40(((( paranteză
41)))) paranteză dreapta
42**** asterisc
43++++ semnul plus
44,,,, virgulă
45---- cratimă-minus
46.... punct
47//// solidus
480000 cifre la zero
491111 o cifră
502222 cifre două
513333 cifre trei
524444 cifre patru
535555 cifre cinci
546666 cifre șase
557777 șapte cifre
568888 opt cifre
579999 cifră nouă
58:::: colon
59;;;; punct şi virgulă
60<<<< mai puțin decât semnul
61==== semnul egal
62>>>> mai mare decât semnul
63???? semnul întrebării
64@@@@ comercial la
65AAAA Latină scrisoare de capital A
66BBBB Latină scrisoare de capital B
67CCCC Latină scrisoare de capital C
68DDDD majusculă latină D
69EEEE majusculă latină E
70FFFF Latină scrisoare de capital F
71GGGG majusculă latină G
72HHHH Latină scrisoare de capital H
73IIII I latin majusculă
74JJJJ Latină scrisoare de capital J
75KKKK Latină scrisoare de capital K
76LLLL Latină scrisoare de capital L
77MMMM Latină scrisoare de capital M
78NNNN Latină majusculă N
79OOOO Latină O scrisoare de capital
80PPPP majusculă latină P
81QQQQ Latină Q scrisoare de capital
82RRRR Latină R scrisoare de capital
83SSSS Latină scrisoare de capital S
84TTTT majusculă latină T
85UUUU Latină scrisoare de capital U
86VVVV Latină scrisoare de capital V
87WWWW Latină scrisoare de capital W
88XXXX Latină scrisoare de capital X
89YYYY Latină scrisoarea de capital Y
90ZZZZ Latină Z scrisoare de capital
91[[[[ paranteză pătrată
92\\\\ solidus inversă
93]]]] Paranteză pătrată dreapta
94^^^^ accent circumflex
95____ linie joasă
96```` accent grav
97aaaa literă latină o
98bbbb Mic latin b
99cccc Latină mici litera c
100dddd Mic latin d
101eeee Mic latin e
102ffff Latină mici f scrisoare
103gggg Latină mici g scrisoare
104hhhh Latină mici h scrisoare
105iiii Latină i mic scrisoare
106jjjj Latină mici litera j
107kkkk Latină mici k scrisoare
108llll Latină mici l scrisoare
109mmmm Latină mici m scrisoare
110nnnn Latină mici n litere
111oooo Latină mici o scrisoare
112pppp Latină mici litera p
113qqqq Latină q litere mici
114rrrr Latină mici r scrisoare
115ssss Latină mici s scrisoare
116tttt Latină t mic scrisoare
117uuuu Mic latin u
118vvvv Latină mici v scrisoare
119wwww litere latine mici w
120xxxx Latină x literă mică
121yyyy Latină mici y litere
122zzzz Latină mici litera Z
123{{{{ acoladă
124|||| linie verticala
125}}}} acoladă
126~~~~ tildă
127DEL   
128    semn de euro
129  NEFOLOSIT
130    un singur 9 scăzut Ghilimele
131 ƒ   litere latine mici f cu cârlig
132    dublu-9 redus Ghilimele
133    elipsă orizontală
134    pumnal
135    dublu pumnal
136 ˆ   scrisoare modificator de accent circumflex
137    per mille semn
138 Š   Latină S scrisoare de capital cu Caron
139    apostrof unghi îndreptat în stânga
140 Œ   de capital Latină ligatură OE
141  NEFOLOSIT
142 Z   Latină Z scrisoare de capital cu Caron
143  NEFOLOSIT
144  NEFOLOSIT
145    marca de stânga singur citat
146    Semn simplu citat
147    Ghilimele duble stânga
148    Ghilimele duble dreapta
149    glonţ
150    cratimă
151    liniuţă em
152 ˜   mici tilda
153    semn marcă
154 š   Mic latin s cu Caron
155    Marcajul unghiului de cotare unică dreapta Indicare
156 œ   Latină oe ligatură mici
157  NEFOLOSIT
158 z   Latină z scrisoare mic cu Caron
159 Ÿ   majusculă latină Y cu diereză
160     neseparator spațiu
161  semn de exclamare inversata
162 ¢¢¢ semn suta
163 £££ semnul diez
164  semn valută
165 ¥¥¥ semn de yeni
166 ¦¦¦ bar rupt
167 §§§ semn secțiune
168 ¨¨¨ tremă
169 ©©© semn drepturile de autor
170 ªªª Indicatorul ordinal feminin
171 ««« stânga arătând ghilimelelor unghi
172  nu semna
173 ­­­ cratimă moale
174 ®®® semn înregistrat
175 ¯¯¯ Macron
176 °°° semn de studii
177 ±±± plus-minus semnul
178 ²²² superscript doi
179 ³³³ superscript trei
180  accent ascuțit
181 µµµ semn de micro
182  semn pilcrow
183 ··· interpunct
184 ... sedilă
185 ªªª un exponent
186  Indicatorul ordinal masculin
187 »»» dreapta arătând unghi dublu Ghilimele
188 1/41/41/4 fracțiune vulgară un sfert
189 1/21/21/2 fracțiune vulgar jumătate
190 3/43/43/4 fracțiune vulgar trei sferturi
191  semn de întrebare inversata
192 ÀÀÀ Latină majusculă A cu gravă
193 ÁÁÁ Latină scrisoare de capital A cu acută
194 ÂÂÂ Latină scrisoare de capital A cu circumflex
195 ÃÃÃ Latină scrisoare de capital A cu tilda
196 ÄÄÄ Latină scrisoare de capital A cu diereză
197 ÅÅÅ Latină majusculă A cu inel de mai sus
198 ÆÆÆ Latină scrisoare de capital AE
199 CCC Latină C scrisoare de capital cu sedilă
200 EEE Latină E scrisoare de capital cu grave
201 EEE Latină E majusculă cu acută
202 EEE E Latină scrisoare de capital cu circumflex
203 EEE E Latină scrisoare de capital cu diereză
204 III majusculă I latin cu grave
205 III majusculă I latin cu acută
206 III majusculă I latin cu circumflex
207 III majusculă I latin cu diereză
208 ÐÐÐ Latină scrisoare de capital Eth
209 ÑÑÑ Latină N majusculă cu tilda
210 OOO Latină O scrisoare de capital cu grave
211 OOO Latină O scrisoare de capital cu acută
212 OOO Latină O scrisoare de capital cu circumflex
213 OOO Latină O scrisoare de capital cu tilda
214 OOO Latină O scrisoare de capital cu diereză
215 ××× semn de multiplicare
216 ØØØ Latină O scrisoare de capital cu accident vascular cerebral
217 UUU majusculă latină U cu grave
218 UUU majusculă latină U cu acută
219 UUU majusculă latină U cu circumflex
220 UUU majusculă latină U cu diereză
221 YYY majusculă latină Y cu acută
222 ÞÞÞ Latină Thorn scrisoare de capital
223 ßßß litere latine mici s ascuțite
224 aaa Latină o literă mică, cu grave
225 aaa Latină o literă mică, cu acută
226 aaa Latină o literă mică, cu accent circumflex
227 aaa Latină o literă mică cu tilda
228 aaa Latină o literă mică cu diereză
229 aaa Latină o literă mică, cu inel de mai sus
230 aaa Latină ae litere mici
231 ccc litere latine mici, c cu sedilă
232 eee Latină mici, e scrisoare cu grave
233 eee Latină mici, e cu litere acută
234 eee Latină mici, e scrisoare cu circumflex
235 eee Latină mici, e scrisoare cu diereză
236 iii Mic latin i cu grave
237 iii Latină litere mici i cu acută
238 iii Mic latin i cu circumflex
239 iii Mic latin i cu diereză
240  Latină ETH litere mici
241 nnn Latină n litere mici cu tilda
242 ooo litere latine mici, cu o gravă
243 ooo litere latine mici, cu o acută
244 ooo litere latine mici, cu o circumflex
245 ooo litere latine mici, cu o tilda
246 ooo litere latine mici o cu diereză
247 ÷÷÷ semn diviziune
248  litere latine mici o cu accident vascular cerebral
249 uuu Mic latin u cu grave
250 uuu Mic latin u cu acută
251 uuu litere latine mici, cu circumflex
252 uuu Mic latin u cu diereză
253 yyy Latină mici, y scrisoare cu acută
254 þþþ Latină ghimpe litere mici
255 yyy Latină mici, y scrisoare cu diereză

Setul ASCII Caracter

ASCII utilizează valorile de la 0 la 31 (and 127) pentru caractere de control.

ASCII utilizează valorile de la 32 la 126 de litere, cifre și simboluri.

ASCII nu utilizează valorile 128-255.


ANSI set de caractere (Windows-1252)

ANSI este identic cu ASCII pentru valorile 0-127.

ANSI are un set propriu de caractere pentru valorile de la 128 la 159.

ANSI este identic cu UTF-8 pentru valorile de la 160 la 255.


Setul de caractere ISO-8859-1

8859-1 este identic cu ASCII pentru valorile 0-127.

8859-1 nu utilizează valorile 128-159.

8859-1 este identic cu UTF-8 pentru valorile de la 160 la 255.


Setul UTF-8 caractere

UTF-8 este identică cu ASCII pentru valori de la 0 la 127.

UTF-8 nu utilizează valorile 128-159.

UTF-8 este identică cu atât ANSI și 8859-1 pentru valorile de la 160 la 255.

UTF-8 continuă de la valoarea 256, cu mai mult de 10 000 de caractere diferite.

Pentru o privire mai atentă, studiul nostru complet HTML Set de caractere de referință .