Pour afficher une page HTML correctement, un navigateur Web doit connaître le jeu de caractères (character encoding) à utiliser.
Qu'est-ce que l'encodage de caractères?
ASCII a été la première norme de codage de caractères (également appelé jeu de caractères). Il définit 127 différents caractères alphanumériques qui pourraient être utilisés sur Internet.
HTML (Hypertext Markup Language) a été utilisé depuis 1991, mais HTML 4.0 (Décembre 1997) a été la première version normalisée où les caractères internationaux ont reçu un traitement assez complet. Lorsqu'un document HTML contient des caractères spéciaux en dehors de la plage de ASCII à sept bits deux buts sont à considérer: l'intégrité de l'information et l'affichage du navigateur universel.
Numéros pris en charge ASCII (0-9) , lettres anglaises (AZ) , et certains caractères spéciaux comme ! $ + - ( ) @ < > ! $ + - ( ) @ < > .
ANSI (Windows-1252) était le jeu de caractères Windows d' origine. Elle a soutenu 256 codes de caractères différents.
ISO-8859-1 est le caractère par défaut pour HTML 4. Il a également soutenu 256 codes de caractères différents.
Parce que ANSI et ISO étaient limitées, le codage de caractères par défaut a été changé en UTF-8 en HTML5.
UTF-8 (Unicode) couvre presque tous les personnages et les symboles dans le monde.
Tous les processeurs HTML 4 prennent également en charge UTF-8.
Le code HTML charset Attribute
Pour afficher une page HTML correctement, un navigateur Web doit connaître le jeu de caractères utilisé dans la page.
Ceci est spécifié dans le <meta> tag:
Pour HTML4:
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
Pour HTML5:
<meta charset="UTF-8">
Si un navigateur détecte ISO-8859-1 dans une page Web, sa valeur par défaut ANSI, car ANSI est identique à la norme ISO-8859-1, sauf que ANSI a 32 caractères supplémentaires.
Différences entre les jeux de caractères
Le tableau suivant présente les différences entre les jeux de caractères décrits ci-dessus:
Numb | ASCII | ANSI | 8859 | UTF-8 | La description |
---|---|---|---|---|---|
32 | espace | ||||
33 | ! | ! | ! | ! | point d'exclamation |
34 | " | " | " | " | Guillemet |
35 | # | # | # | # | signe dièse |
36 | $ | $ | $ | $ | signe dollar |
37 | % | % | % | % | signe pour cent |
38 | & | & | & | & | esperluette |
39 | ' | ' | ' | ' | apostrophe |
40 | ( | ( | ( | ( | gauche entre parenthèses |
41 | ) | ) | ) | ) | parenthèse droite |
42 | * | * | * | * | astérisque |
43 | + | + | + | + | signe plus |
44 | , | , | , | , | virgule |
45 | - | - | - | - | Tiret |
46 | . | . | . | . | arrêt complet |
47 | / | / | / | / | solidus |
48 | 0 | 0 | 0 | 0 | zéro chiffres |
49 | 1 | 1 | 1 | 1 | un chiffre |
50 | 2 | 2 | 2 | 2 | deux chiffres |
51 | 3 | 3 | 3 | 3 | trois chiffres |
52 | 4 | 4 | 4 | 4 | quatre chiffres |
53 | 5 | 5 | 5 | 5 | cinq chiffres |
54 | 6 | 6 | 6 | 6 | six chiffres |
55 | 7 | 7 | 7 | 7 | sept chiffres |
56 | 8 | 8 | 8 | 8 | huit chiffres |
57 | 9 | 9 | 9 | 9 | neuf chiffres |
58 | : | : | : | : | côlon |
59 | ; | ; | ; | ; | point-virgule |
60 | < | < | < | < | moins que signe |
61 | = | = | = | = | signe égal |
62 | > | > | > | > | signe supérieur |
63 | ? | ? | ? | ? | point d'interrogation |
64 | @ | @ | @ | @ | commercial à |
65 | A | A | A | A | lettre majuscule latine A |
66 | B | B | B | B | lettre B majuscule latine |
67 | C | C | C | C | lettre majuscule latine C |
68 | D | D | D | D | lettre majuscule latine D |
69 | E | E | E | E | lettre majuscule latine E |
70 | F | F | F | F | lettre majuscule latine F |
71 | G | G | G | G | lettre majuscule latine G |
72 | H | H | H | H | lettre majuscule latine H |
73 | I | I | I | I | lettre majuscule latine I |
74 | J | J | J | J | lettre majuscule latine J |
75 | K | K | K | K | lettre majuscule latine K |
76 | L | L | L | L | lettre majuscule latine L |
77 | M | M | M | M | lettre majuscule latine M |
78 | N | N | N | N | lettre majuscule latine N |
79 | O | O | O | O | lettre O majuscule latine |
80 | P | P | P | P | lettre majuscule latine P |
81 | Q | Q | Q | Q | lettre majuscule latine Q |
82 | R | R | R | R | lettre R majuscule latine |
83 | S | S | S | S | lettre majuscule latine S |
84 | T | T | T | T | lettre majuscule latine T |
85 | U | U | U | U | lettre majuscule latine U |
86 | V | V | V | V | lettre majuscule latine V |
87 | W | W | W | W | lettre majuscule latine W |
88 | X | X | X | X | lettre majuscule latine X |
89 | Y | Y | Y | Y | lettre majuscule latine Y |
90 | Z | Z | Z | Z | lettre majuscule latine Z |
91 | [ | [ | [ | [ | crochet gauche |
92 | \ | \ | \ | \ | inverse solidus |
93 | ] | ] | ] | ] | crochet droit |
94 | ^ | ^ | ^ | ^ | accent circonflexe |
95 | _ | _ | _ | _ | ligne basse |
96 | ` | ` | ` | ` | accent grave |
97 | a | a | a | a | une petite lettre latine |
98 | b | b | b | b | lettre minuscule latine b |
99 | c | c | c | c | lettre minuscule latine c |
100 | d | d | d | d | lettre minuscule latine d |
101 | e | e | e | e | petite latine lettre e |
102 | f | f | f | f | lettre minuscule latine f |
103 | g | g | g | g | petit latin lettre g |
104 | h | h | h | h | h Lettre minuscule latine |
105 | i | i | i | i | i Lettre minuscule latine |
106 | j | j | j | j | j Lettre minuscule latine |
107 | k | k | k | k | k Lettre minuscule latine |
108 | l | l | l | l | petite lettre l latine |
109 | m | m | m | m | petite latine lettre m |
110 | n | n | n | n | petite lettre n latin |
111 | o | o | o | o | o Lettre minuscule latine |
112 | p | p | p | p | petite lettre p latine |
113 | q | q | q | q | petit latin lettre q |
114 | r | r | r | r | petite lettre r latine |
115 | s | s | s | s | s Lettre minuscule latine |
116 | t | t | t | t | petite lettre t latin |
117 | u | u | u | u | petite latine lettre u |
118 | v | v | v | v | lettre minuscule latine v |
119 | w | w | w | w | petite latine lettre w |
120 | x | x | x | x | x Lettre minuscule latine |
121 | y | y | y | y | petite lettre y latin |
122 | z | z | z | z | petite lettre z latin |
123 | { | { | { | { | Accolade gauche |
124 | | | | | | | | | ligne verticale |
125 | } | } | } | } | Accolade droite |
126 | ~ | ~ | ~ | ~ | tilde |
127 | DEL | ||||
128 | € | signe euro | |||
129 | NON UTILISÉ | ||||
130 | ‚ | apostrophe faible 9 | |||
131 | ƒ | petite latine lettre f avec crochet | |||
132 | „ | double-bas 9 guillemets | |||
133 | … | horizontal ellipsis | |||
134 | † | poignard | |||
135 | ‡ | double croix | |||
136 | ˆ | lettre modificative accent circonflexe | |||
137 | ‰ | par signe mille | |||
138 | Š | lettre majuscule latine S CARON | |||
139 | ‹ | Guillemet simple angle pointant vers la gauche | |||
140 | Œ | Ligature capitale latine OE | |||
141 | NON UTILISÉ | ||||
142 | Z | lettre majuscule latine Z caron | |||
143 | NON UTILISÉ | ||||
144 | NON UTILISÉ | ||||
145 | ‘ | guillemet simple gauche | |||
146 | ’ | guillemet simple droit | |||
147 | “ | guillemet double gauche | |||
148 | ” | guillemet double droit | |||
149 | • | balle | |||
150 | – | en tableau de bord | |||
151 | — | tiret cadratin | |||
152 | ˜ | petit tilde | |||
153 | ™ | signe de la marque | |||
154 | š | petite latine lettre s caron | |||
155 | › | guillemet simple angle pointant vers la droite | |||
156 | œ | petit ligatures oe latin | |||
157 | NON UTILISÉ | ||||
158 | z | petite latine lettre z caron | |||
159 | Ÿ | lettre majuscule latine Y avec tréma | |||
160 | Espace insécable | ||||
161 | marque d'exclamation inversé | ||||
162 | ¢ | ¢ | ¢ | signe cent | |
163 | £ | £ | £ | signe dièse | |
164 | signe monétaire | ||||
165 | ¥ | ¥ | ¥ | signe yen | |
166 | ¦ | ¦ | ¦ | bar cassé | |
167 | § | § | § | signe section | |
168 | ¨ | ¨ | ¨ | tréma | |
169 | © | © | © | Signe du droit d'auteur | |
170 | ª | ª | ª | Indicateur ordinal féminin | |
171 | « | « | « | pointant vers la gauche guillemet double angle | |
172 | pas signer | ||||
173 | | | | trait d'union | |
174 | ® | ® | ® | signe enregistré | |
175 | ¯ | ¯ | ¯ | Macron | |
176 | ° | ° | ° | signe de degré | |
177 | ± | ± | ± | plus-signe moins | |
178 | ² | ² | ² | deux superscript | |
179 | ³ | ³ | ³ | trois superscript | |
180 | accent aigu | ||||
181 | µ | µ | µ | micro signe | |
182 | signe pied-de-mouche | ||||
183 | · | · | · | point milieu | |
184 | . | . | . | cédille | |
185 | ª | ª | ª | un indice supérieur | |
186 | Indicateur ordinal masculin | ||||
187 | » | » | » | pointant vers la droite à double angle guillemet | |
188 | 1/4 | 1/4 | 1/4 | FRACTION un quart | |
189 | 1/2 | 1/2 | 1/2 | fraction vulgaire une demi | |
190 | 3/4 | 3/4 | 3/4 | fraction vulgaire trois quarts | |
191 | point d'interrogation inversé | ||||
192 | À | À | À | lettre majuscule latine A tombe | |
193 | Á | Á | Á | lettre majuscule latine A aiguë | |
194 | Â | Â | Â | lettre majuscule latine A circonflexe | |
195 | Ã | Ã | Ã | lettre majuscule latine A tilde | |
196 | Ä | Ä | Ä | lettre majuscule avec un tréma | |
197 | Å | Å | Å | lettre majuscule latine A ROND | |
198 | Æ | Æ | Æ | lettre majuscule latine AE | |
199 | C | C | C | lettre majuscule latine C cédille | |
200 | E | E | E | lettre majuscule latine E tombe | |
201 | E | E | E | lettre majuscule latine E aiguë | |
202 | E | E | E | lettre majuscule latine E circonflexe | |
203 | E | E | E | lettre majuscule latine E tréma | |
204 | I | I | I | lettre majuscule latine I tombe | |
205 | I | I | I | lettre majuscule latine I aiguë | |
206 | I | I | I | lettre majuscule latine I circonflexe | |
207 | I | I | I | lettre majuscule latine I avec tréma | |
208 | Ð | Ð | Ð | lettre majuscule latine Eth | |
209 | Ñ | Ñ | Ñ | lettre majuscule latine N avec tilde | |
210 | O | O | O | lettre majuscule latine O tombe | |
211 | O | O | O | lettre majuscule latine O aiguë | |
212 | O | O | O | lettre majuscule latine O circonflexe | |
213 | O | O | O | lettre majuscule latine O tilde | |
214 | O | O | O | lettre majuscule latine O tréma | |
215 | × | × | × | signe de multiplication | |
216 | Ø | Ø | Ø | lettre majuscule latine O AVC | |
217 | U | U | U | lettre majuscule latine U tombe | |
218 | U | U | U | lettre majuscule latine U aiguë | |
219 | U | U | U | lettre majuscule latine U circonflexe | |
220 | U | U | U | lettre majuscule latine U tréma | |
221 | Y | Y | Y | lettre majuscule latine Y avec aiguë | |
222 | Þ | Þ | Þ | lettre majuscule latine Thorn | |
223 | ß | ß | ß | petite latine lettre s forte | |
224 | a | a | a | une GRAVE Lettre minuscule latine | |
225 | a | a | a | lettre minuscule latine avec une aiguë | |
226 | a | a | a | un circonflexe Lettre minuscule latine | |
227 | a | a | a | un avec tilde Lettre minuscule latine | |
228 | a | a | a | avec un tréma Lettre minuscule latine | |
229 | a | a | a | lettre minuscule latine un ROND | |
230 | a | a | a | petite lettre ae latine | |
231 | c | c | c | petite latine lettre c cédille | |
232 | e | e | e | petite latine lettre e GRAVE | |
233 | e | e | e | lettre minuscule latine e avec aiguë | |
234 | e | e | e | petite latine lettre e avec circonflexe | |
235 | e | e | e | petite latine lettre e avec tréma | |
236 | i | i | i | petite latine lettre i avec la tombe | |
237 | i | i | i | petite latine lettre i avec aiguë | |
238 | i | i | i | petite latine lettre i avec circonflexe | |
239 | i | i | i | petite latine lettre i avec tréma | |
240 | petite latine lettre eth | ||||
241 | n | n | n | lettre minuscule n latin avec tilde | |
242 | o | o | o | petite latine lettre o avec la tombe | |
243 | o | o | o | petite latine lettre o avec aiguë | |
244 | o | o | o | petite latine lettre o circonflexe | |
245 | o | o | o | petite latine lettre o avec tilde | |
246 | o | o | o | petite latine lettre o avec tréma | |
247 | ÷ | ÷ | ÷ | signe de division | |
248 | petite latine lettre o avec AVC | ||||
249 | u | u | u | petite latine lettre u avec tombe | |
250 | u | u | u | petite latine lettre u avec aiguë | |
251 | u | u | u | petite latine lettre circonflexe | |
252 | u | u | u | petite latine lettre u avec tréma | |
253 | y | y | y | petite lettre y latine aiguë | |
254 | þ | þ | þ | épine Lettre minuscule latine | |
255 | y | y | y | petite latine lettre y TRÉMA |
Le jeu de caractères ASCII
ASCII utilise les valeurs de 0 à 31 (and 127) pour les caractères de contrôle.
ASCII utilise les valeurs de 32 à 126 pour les lettres, des chiffres et des symboles.
ASCII ne pas utiliser les valeurs 128-255.
Le jeu de caractères ANSI (Windows-1252)
ANSI est identique à ASCII pour les valeurs de 0 à 127.
ANSI a un jeu de caractères pour les valeurs de 128 à 159.
ANSI est identique à UTF-8 pour les valeurs de 160 à 255.
Le jeu de caractères ISO-8859-1
8859-1 est identique à ASCII pour les valeurs de 0 à 127.
8859-1 ne pas utiliser les valeurs 128-159.
8859-1 est identique à UTF-8 pour les valeurs de 160 à 255.
L'UTF-8 Jeu de caractères
UTF-8 est identique à ASCII pour les valeurs de 0 à 127.
UTF-8 n'utilise pas les valeurs 128-159.
UTF-8 est identique à la fois ANSI et 8859-1 pour les valeurs de 160 à 255.
UTF-8 continue à partir de la valeur 256 à plus de 10 000 caractères différents.
Pour regarder de plus près, étudier notre ensemble complet HTML caractère de référence .