Pentru a afișa corect o pagină HTML, un browser web trebuie să cunoască setul de caractere (character encoding) de (character encoding) a (character encoding) pentru a utiliza.
Ce este Codificare caractere?
ASCII a fost primul standard de codificare a caracterelor (numit , de asemenea , setul de caractere). Acesta definește 127 de caractere alfanumerice diferite, care ar putea fi utilizate pe internet.
Numerele ASCII sprijinit (0-9) , litere englezești (AZ) , și unele caractere speciale , cum ar fi ! $ + - ( ) @ < > ! $ + - ( ) @ < > .
ANSI (Windows-1252) a fost original , setul de caractere pentru Windows. Acesta a sprijinit 256 de coduri de caractere diferite.
ISO-8859-1 a fost caracterul setat implicit pentru HTML 4. De asemenea, a sprijinit 256 de coduri de caractere diferite.
Deoarece ANSI și ISO au fost limitate, codificarea caracterelor implicită a fost schimbat la UTF-8 în HTML5.
UTF-8 (Unicode) acoperă aproape toate caracterele și simbolurile din lume.
Toate HTML 4 procesoare suporta de asemenea UTF-8.
HTML charset Atributul
Pentru a afișa corect o pagină HTML, un browser web trebuie să cunoască setul de caractere utilizat în pagina.
Acest lucru este specificat în <meta> tag - ul:
Pentru HTML4:
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
Pentru HTML5:
<meta charset="UTF-8">
În cazul în care un browser detectează ISO-8859-1 într-o pagină web, acesta implicit la ANSI, deoarece ANSI este identic cu ISO-8859-1 cu excepția faptului că ANSI are 32 de caractere suplimentare.
Diferențe între seturi de caractere
Tabelul de mai jos prezintă diferențele dintre seturile de caractere descrise mai sus:
Numb | ASCII | ANSI | 8859 | UTF-8 | Descriere |
---|---|---|---|---|---|
32 | spaţiu | ||||
33 | ! | ! | ! | ! | Semnul exclamarii |
34 | " | " | " | " | Ghilimele |
35 | # | # | # | # | semn numărul |
36 | $ | $ | $ | $ | semnul dolarului |
37 | % | % | % | % | semn la sută |
38 | & | & | & | & | ampersand |
39 | ' | ' | ' | ' | apostrof |
40 | ( | ( | ( | ( | paranteză |
41 | ) | ) | ) | ) | paranteză dreapta |
42 | * | * | * | * | asterisc |
43 | + | + | + | + | semnul plus |
44 | , | , | , | , | virgulă |
45 | - | - | - | - | cratimă-minus |
46 | . | . | . | . | punct |
47 | / | / | / | / | solidus |
48 | 0 | 0 | 0 | 0 | cifre la zero |
49 | 1 | 1 | 1 | 1 | o cifră |
50 | 2 | 2 | 2 | 2 | cifre două |
51 | 3 | 3 | 3 | 3 | cifre trei |
52 | 4 | 4 | 4 | 4 | cifre patru |
53 | 5 | 5 | 5 | 5 | cifre cinci |
54 | 6 | 6 | 6 | 6 | cifre șase |
55 | 7 | 7 | 7 | 7 | șapte cifre |
56 | 8 | 8 | 8 | 8 | opt cifre |
57 | 9 | 9 | 9 | 9 | cifră nouă |
58 | : | : | : | : | colon |
59 | ; | ; | ; | ; | punct şi virgulă |
60 | < | < | < | < | mai puțin decât semnul |
61 | = | = | = | = | semnul egal |
62 | > | > | > | > | mai mare decât semnul |
63 | ? | ? | ? | ? | semnul întrebării |
64 | @ | @ | @ | @ | comercial la |
65 | A | A | A | A | Latină scrisoare de capital A |
66 | B | B | B | B | Latină scrisoare de capital B |
67 | C | C | C | C | Latină scrisoare de capital C |
68 | D | D | D | D | majusculă latină D |
69 | E | E | E | E | majusculă latină E |
70 | F | F | F | F | Latină scrisoare de capital F |
71 | G | G | G | G | majusculă latină G |
72 | H | H | H | H | Latină scrisoare de capital H |
73 | I | I | I | I | I latin majusculă |
74 | J | J | J | J | Latină scrisoare de capital J |
75 | K | K | K | K | Latină scrisoare de capital K |
76 | L | L | L | L | Latină scrisoare de capital L |
77 | M | M | M | M | Latină scrisoare de capital M |
78 | N | N | N | N | Latină majusculă N |
79 | O | O | O | O | Latină O scrisoare de capital |
80 | P | P | P | P | majusculă latină P |
81 | Q | Q | Q | Q | Latină Q scrisoare de capital |
82 | R | R | R | R | Latină R scrisoare de capital |
83 | S | S | S | S | Latină scrisoare de capital S |
84 | T | T | T | T | majusculă latină T |
85 | U | U | U | U | Latină scrisoare de capital U |
86 | V | V | V | V | Latină scrisoare de capital V |
87 | W | W | W | W | Latină scrisoare de capital W |
88 | X | X | X | X | Latină scrisoare de capital X |
89 | Y | Y | Y | Y | Latină scrisoarea de capital Y |
90 | Z | Z | Z | Z | Latină Z scrisoare de capital |
91 | [ | [ | [ | [ | paranteză pătrată |
92 | \ | \ | \ | \ | solidus inversă |
93 | ] | ] | ] | ] | Paranteză pătrată dreapta |
94 | ^ | ^ | ^ | ^ | accent circumflex |
95 | _ | _ | _ | _ | linie joasă |
96 | ` | ` | ` | ` | accent grav |
97 | a | a | a | a | literă latină o |
98 | b | b | b | b | Mic latin b |
99 | c | c | c | c | Latină mici litera c |
100 | d | d | d | d | Mic latin d |
101 | e | e | e | e | Mic latin e |
102 | f | f | f | f | Latină mici f scrisoare |
103 | g | g | g | g | Latină mici g scrisoare |
104 | h | h | h | h | Latină mici h scrisoare |
105 | i | i | i | i | Latină i mic scrisoare |
106 | j | j | j | j | Latină mici litera j |
107 | k | k | k | k | Latină mici k scrisoare |
108 | l | l | l | l | Latină mici l scrisoare |
109 | m | m | m | m | Latină mici m scrisoare |
110 | n | n | n | n | Latină mici n litere |
111 | o | o | o | o | Latină mici o scrisoare |
112 | p | p | p | p | Latină mici litera p |
113 | q | q | q | q | Latină q litere mici |
114 | r | r | r | r | Latină mici r scrisoare |
115 | s | s | s | s | Latină mici s scrisoare |
116 | t | t | t | t | Latină t mic scrisoare |
117 | u | u | u | u | Mic latin u |
118 | v | v | v | v | Latină mici v scrisoare |
119 | w | w | w | w | litere latine mici w |
120 | x | x | x | x | Latină x literă mică |
121 | y | y | y | y | Latină mici y litere |
122 | z | z | z | z | Latină mici litera Z |
123 | { | { | { | { | acoladă |
124 | | | | | | | | | linie verticala |
125 | } | } | } | } | acoladă |
126 | ~ | ~ | ~ | ~ | tildă |
127 | DEL | ||||
128 | € | semn de euro | |||
129 | NEFOLOSIT | ||||
130 | ‚ | un singur 9 scăzut Ghilimele | |||
131 | ƒ | litere latine mici f cu cârlig | |||
132 | „ | dublu-9 redus Ghilimele | |||
133 | … | elipsă orizontală | |||
134 | † | pumnal | |||
135 | ‡ | dublu pumnal | |||
136 | ˆ | scrisoare modificator de accent circumflex | |||
137 | ‰ | per mille semn | |||
138 | Š | Latină S scrisoare de capital cu Caron | |||
139 | ‹ | apostrof unghi îndreptat în stânga | |||
140 | Œ | de capital Latină ligatură OE | |||
141 | NEFOLOSIT | ||||
142 | Z | Latină Z scrisoare de capital cu Caron | |||
143 | NEFOLOSIT | ||||
144 | NEFOLOSIT | ||||
145 | ‘ | marca de stânga singur citat | |||
146 | ’ | Semn simplu citat | |||
147 | “ | Ghilimele duble stânga | |||
148 | ” | Ghilimele duble dreapta | |||
149 | • | glonţ | |||
150 | – | cratimă | |||
151 | — | liniuţă em | |||
152 | ˜ | mici tilda | |||
153 | ™ | semn marcă | |||
154 | š | Mic latin s cu Caron | |||
155 | › | Marcajul unghiului de cotare unică dreapta Indicare | |||
156 | œ | Latină oe ligatură mici | |||
157 | NEFOLOSIT | ||||
158 | z | Latină z scrisoare mic cu Caron | |||
159 | Ÿ | majusculă latină Y cu diereză | |||
160 | neseparator spațiu | ||||
161 | semn de exclamare inversata | ||||
162 | ¢ | ¢ | ¢ | semn suta | |
163 | £ | £ | £ | semnul diez | |
164 | semn valută | ||||
165 | ¥ | ¥ | ¥ | semn de yeni | |
166 | ¦ | ¦ | ¦ | bar rupt | |
167 | § | § | § | semn secțiune | |
168 | ¨ | ¨ | ¨ | tremă | |
169 | © | © | © | semn drepturile de autor | |
170 | ª | ª | ª | Indicatorul ordinal feminin | |
171 | « | « | « | stânga arătând ghilimelelor unghi | |
172 | nu semna | ||||
173 | | | | cratimă moale | |
174 | ® | ® | ® | semn înregistrat | |
175 | ¯ | ¯ | ¯ | Macron | |
176 | ° | ° | ° | semn de studii | |
177 | ± | ± | ± | plus-minus semnul | |
178 | ² | ² | ² | superscript doi | |
179 | ³ | ³ | ³ | superscript trei | |
180 | accent ascuțit | ||||
181 | µ | µ | µ | semn de micro | |
182 | semn pilcrow | ||||
183 | · | · | · | interpunct | |
184 | . | . | . | sedilă | |
185 | ª | ª | ª | un exponent | |
186 | Indicatorul ordinal masculin | ||||
187 | » | » | » | dreapta arătând unghi dublu Ghilimele | |
188 | 1/4 | 1/4 | 1/4 | fracțiune vulgară un sfert | |
189 | 1/2 | 1/2 | 1/2 | fracțiune vulgar jumătate | |
190 | 3/4 | 3/4 | 3/4 | fracțiune vulgar trei sferturi | |
191 | semn de întrebare inversata | ||||
192 | À | À | À | Latină majusculă A cu gravă | |
193 | Á | Á | Á | Latină scrisoare de capital A cu acută | |
194 | Â | Â | Â | Latină scrisoare de capital A cu circumflex | |
195 | Ã | Ã | Ã | Latină scrisoare de capital A cu tilda | |
196 | Ä | Ä | Ä | Latină scrisoare de capital A cu diereză | |
197 | Å | Å | Å | Latină majusculă A cu inel de mai sus | |
198 | Æ | Æ | Æ | Latină scrisoare de capital AE | |
199 | C | C | C | Latină C scrisoare de capital cu sedilă | |
200 | E | E | E | Latină E scrisoare de capital cu grave | |
201 | E | E | E | Latină E majusculă cu acută | |
202 | E | E | E | E Latină scrisoare de capital cu circumflex | |
203 | E | E | E | E Latină scrisoare de capital cu diereză | |
204 | I | I | I | majusculă I latin cu grave | |
205 | I | I | I | majusculă I latin cu acută | |
206 | I | I | I | majusculă I latin cu circumflex | |
207 | I | I | I | majusculă I latin cu diereză | |
208 | Ð | Ð | Ð | Latină scrisoare de capital Eth | |
209 | Ñ | Ñ | Ñ | Latină N majusculă cu tilda | |
210 | O | O | O | Latină O scrisoare de capital cu grave | |
211 | O | O | O | Latină O scrisoare de capital cu acută | |
212 | O | O | O | Latină O scrisoare de capital cu circumflex | |
213 | O | O | O | Latină O scrisoare de capital cu tilda | |
214 | O | O | O | Latină O scrisoare de capital cu diereză | |
215 | × | × | × | semn de multiplicare | |
216 | Ø | Ø | Ø | Latină O scrisoare de capital cu accident vascular cerebral | |
217 | U | U | U | majusculă latină U cu grave | |
218 | U | U | U | majusculă latină U cu acută | |
219 | U | U | U | majusculă latină U cu circumflex | |
220 | U | U | U | majusculă latină U cu diereză | |
221 | Y | Y | Y | majusculă latină Y cu acută | |
222 | Þ | Þ | Þ | Latină Thorn scrisoare de capital | |
223 | ß | ß | ß | litere latine mici s ascuțite | |
224 | a | a | a | Latină o literă mică, cu grave | |
225 | a | a | a | Latină o literă mică, cu acută | |
226 | a | a | a | Latină o literă mică, cu accent circumflex | |
227 | a | a | a | Latină o literă mică cu tilda | |
228 | a | a | a | Latină o literă mică cu diereză | |
229 | a | a | a | Latină o literă mică, cu inel de mai sus | |
230 | a | a | a | Latină ae litere mici | |
231 | c | c | c | litere latine mici, c cu sedilă | |
232 | e | e | e | Latină mici, e scrisoare cu grave | |
233 | e | e | e | Latină mici, e cu litere acută | |
234 | e | e | e | Latină mici, e scrisoare cu circumflex | |
235 | e | e | e | Latină mici, e scrisoare cu diereză | |
236 | i | i | i | Mic latin i cu grave | |
237 | i | i | i | Latină litere mici i cu acută | |
238 | i | i | i | Mic latin i cu circumflex | |
239 | i | i | i | Mic latin i cu diereză | |
240 | Latină ETH litere mici | ||||
241 | n | n | n | Latină n litere mici cu tilda | |
242 | o | o | o | litere latine mici, cu o gravă | |
243 | o | o | o | litere latine mici, cu o acută | |
244 | o | o | o | litere latine mici, cu o circumflex | |
245 | o | o | o | litere latine mici, cu o tilda | |
246 | o | o | o | litere latine mici o cu diereză | |
247 | ÷ | ÷ | ÷ | semn diviziune | |
248 | litere latine mici o cu accident vascular cerebral | ||||
249 | u | u | u | Mic latin u cu grave | |
250 | u | u | u | Mic latin u cu acută | |
251 | u | u | u | litere latine mici, cu circumflex | |
252 | u | u | u | Mic latin u cu diereză | |
253 | y | y | y | Latină mici, y scrisoare cu acută | |
254 | þ | þ | þ | Latină ghimpe litere mici | |
255 | y | y | y | Latină mici, y scrisoare cu diereză |
Setul ASCII Caracter
ASCII utilizează valorile de la 0 la 31 (and 127) pentru caractere de control.
ASCII utilizează valorile de la 32 la 126 de litere, cifre și simboluri.
ASCII nu utilizează valorile 128-255.
ANSI set de caractere (Windows-1252)
ANSI este identic cu ASCII pentru valorile 0-127.
ANSI are un set propriu de caractere pentru valorile de la 128 la 159.
ANSI este identic cu UTF-8 pentru valorile de la 160 la 255.
Setul de caractere ISO-8859-1
8859-1 este identic cu ASCII pentru valorile 0-127.
8859-1 nu utilizează valorile 128-159.
8859-1 este identic cu UTF-8 pentru valorile de la 160 la 255.
Setul UTF-8 caractere
UTF-8 este identică cu ASCII pentru valori de la 0 la 127.
UTF-8 nu utilizează valorile 128-159.
UTF-8 este identică cu atât ANSI și 8859-1 pentru valorile de la 160 la 255.
UTF-8 continuă de la valoarea 256, cu mai mult de 10 000 de caractere diferite.
Pentru o privire mai atentă, studiul nostru complet HTML Set de caractere de referință .