Um eine HTML - Seite angezeigt wird ein Web - Browser muss korrekt, kennt den Zeichensatz (character encoding) zu verwenden.
Was ist Zeichenkodierung?
ASCII war der erste Zeichencodierungsstandard (auch Zeichensatz genannt). Es definiert 127 verschiedene alphanumerische Zeichen, die im Internet verwendet werden könnten.
HTML (Hypertext Markup Language) ist seit 1991 im Einsatz, aber HTML 4.0 (Dezember 1997) war die erste standardisierte Version, wo internationale Zeichen waren recht vollständige Behandlung. Wenn ein HTML-Dokument außerhalb des Bereichs von sieben-Bit-ASCII-Sonderzeichen enthält zwei Ziele sind eine Überlegung wert: die Integrität der Informationen und Universal-Browser-Anzeige.
ASCII unterstützt Zahlen (0-9) , englische Buchstaben (AZ) und einige Sonderzeichen wie ! $ + - ( ) @ < > ! $ + - ( ) @ < > .
ANSI (Windows-1252) war der ursprüngliche Windows - Zeichensatz. Es unterstützt 256 verschiedene Zeichencodes.
ISO-8859-1 war der Standardzeichensatz für HTML 4. Es unterstützt auch 256 verschiedene Zeichencodes.
Da ANSI und ISO begrenzt waren, wurde die Standard-Zeichenkodierung UTF-8 in HTML5 verändert.
UTF-8 (Unicode) deckt fast alle Zeichen und Symbole in der Welt.
Alle HTML-4-Prozessoren unterstützen auch UTF-8.
Das HTML-Attribut charset
Um richtig eine HTML-Seite angezeigt wird, ein Web-Browser muss den Zeichensatz kennt auf der Seite verwendet.
Dies wird in dem angegebenen <meta> tag:
Für HTML4:
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
Für HTML5:
<meta charset="UTF-8">
Wenn ein Browser ISO-8859-1 in einer Web-Seite erkennt, wird standardmäßig ANSI, weil ANSI ist identisch mit ISO-8859-1, außer dass ANSI 32 zusätzliche Zeichen.
Unterschiede zwischen Zeichensätze
Die folgende Tabelle zeigt die Unterschiede zwischen den Zeichensätzen oben beschrieben:
Numb | ASCII | ANSI | 8859 | UTF-8 | Beschreibung |
---|---|---|---|---|---|
32 | Platz | ||||
33 | ! | ! | ! | ! | Ausrufezeichen |
34 | " | " | " | " | Anführungszeichen |
35 | # | # | # | # | Nummernschild |
36 | $ | $ | $ | $ | Dollarzeichen |
37 | % | % | % | % | Prozentzeichen |
38 | & | & | & | & | Et-Zeichen |
39 | ' | ' | ' | ' | Apostroph |
40 | ( | ( | ( | ( | Klammer auf |
41 | ) | ) | ) | ) | ende Klammer |
42 | * | * | * | * | Sternchen |
43 | + | + | + | + | Pluszeichen |
44 | , | , | , | , | Komma |
45 | - | - | - | - | Bindestrich-Minus |
46 | . | . | . | . | Punkt |
47 | / | / | / | / | Solidus |
48 | 0 | 0 | 0 | 0 | Ziffer Null |
49 | 1 | 1 | 1 | 1 | Ziffer eins |
50 | 2 | 2 | 2 | 2 | Ziffer zwei |
51 | 3 | 3 | 3 | 3 | Ziffer drei |
52 | 4 | 4 | 4 | 4 | Ziffer vier |
53 | 5 | 5 | 5 | 5 | Ziffer fünf |
54 | 6 | 6 | 6 | 6 | Ziffer sechs |
55 | 7 | 7 | 7 | 7 | Ziffer sieben |
56 | 8 | 8 | 8 | 8 | Ziffer acht |
57 | 9 | 9 | 9 | 9 | Ziffer neun |
58 | : | : | : | : | Doppelpunkt |
59 | ; | ; | ; | ; | Semikolon |
60 | < | < | < | < | weniger-als-Zeichen |
61 | = | = | = | = | Gleichheitszeichen |
62 | > | > | > | > | Größer-als-Zeichen |
63 | ? | ? | ? | ? | Fragezeichen |
64 | @ | @ | @ | @ | commercial at |
65 | A | A | A | A | Lateinischer Großbuchstabe A |
66 | B | B | B | B | Lateinischer Großbuchstabe B |
67 | C | C | C | C | Lateinischer Großbuchstabe C |
68 | D | D | D | D | Lateinischer Großbuchstabe D |
69 | E | E | E | E | Lateinischer Großbuchstabe E |
70 | F | F | F | F | Lateinischer Großbuchstabe F |
71 | G | G | G | G | Lateinischer Großbuchstabe G |
72 | H | H | H | H | Lateinischer Großbuchstabe H |
73 | I | I | I | I | Lateinischer Großbuchstabe I |
74 | J | J | J | J | Lateinischer Großbuchstabe J |
75 | K | K | K | K | Lateinischer Großbuchstabe K |
76 | L | L | L | L | Lateinischer Großbuchstabe L |
77 | M | M | M | M | Lateinischer Großbuchstabe M |
78 | N | N | N | N | Lateinischer Großbuchstabe N |
79 | O | O | O | O | Lateinischer Großbuchstabe O |
80 | P | P | P | P | Lateinischer Großbuchstabe P |
81 | Q | Q | Q | Q | Lateinischer Großbuchstabe Q |
82 | R | R | R | R | Lateinischer Großbuchstabe R |
83 | S | S | S | S | Lateinischer Großbuchstabe S |
84 | T | T | T | T | Lateinischer Großbuchstabe T |
85 | U | U | U | U | Lateinischer Großbuchstabe U |
86 | V | V | V | V | Lateinischer Großbuchstabe V |
87 | W | W | W | W | Lateinischer Großbuchstabe W |
88 | X | X | X | X | Lateinischer Großbuchstabe X |
89 | Y | Y | Y | Y | Lateinischer Großbuchstabe Y |
90 | Z | Z | Z | Z | Lateinischer Großbuchstabe Z |
91 | [ | [ | [ | [ | eckige Klammer |
92 | \ | \ | \ | \ | Reverse-Solidus |
93 | ] | ] | ] | ] | eckige Klammer |
94 | ^ | ^ | ^ | ^ | Circumflex |
95 | _ | _ | _ | _ | bodennah |
96 | ` | ` | ` | ` | Gravis |
97 | a | a | a | a | Kleiner lateinischer Buchstabe a |
98 | b | b | b | b | Kleiner lateinischer Buchstabe b |
99 | c | c | c | c | Kleiner lateinischer Buchstabe c |
100 | d | d | d | d | Kleiner lateinischer Buchstabe d |
101 | e | e | e | e | Kleiner lateinischer Buchstabe e |
102 | f | f | f | f | Kleiner lateinischer Buchstabe f |
103 | g | g | g | g | Kleiner lateinischer Buchstabe g |
104 | h | h | h | h | Kleiner lateinischer Buchstabe h |
105 | i | i | i | i | Kleiner lateinischer Buchstabe i |
106 | j | j | j | j | Kleiner lateinischer Buchstabe j |
107 | k | k | k | k | Kleiner lateinischer Buchstabe k |
108 | l | l | l | l | Kleiner lateinischer Buchstabe l |
109 | m | m | m | m | Kleiner lateinischer Buchstabe m |
110 | n | n | n | n | Kleiner lateinischer Buchstabe n |
111 | o | o | o | o | Kleiner lateinischer Buchstabe o |
112 | p | p | p | p | Kleiner lateinischer Buchstabe p |
113 | q | q | q | q | Kleiner lateinischer Buchstabe q |
114 | r | r | r | r | Kleiner lateinischer Buchstabe r |
115 | s | s | s | s | Kleiner lateinischer Buchstabe s |
116 | t | t | t | t | Kleiner lateinischer Buchstabe t |
117 | u | u | u | u | Kleiner lateinischer Buchstabe u |
118 | v | v | v | v | Kleiner lateinischer Buchstabe v |
119 | w | w | w | w | Kleiner lateinischer Buchstabe w |
120 | x | x | x | x | Kleiner lateinischer Buchstabe x |
121 | y | y | y | y | Kleiner lateinischer Buchstabe y |
122 | z | z | z | z | Kleiner lateinischer Buchstabe z |
123 | { | { | { | { | linke geschweifte Klammer |
124 | | | | | | | | | vertikale Linie |
125 | } | } | } | } | geschweifte Klammer |
126 | ~ | ~ | ~ | ~ | Tilde |
127 | DEL | ||||
128 | € | Euro-Zeichen | |||
129 | NICHT BENUTZT | ||||
130 | ‚ | einzige Low-9 Anführungszeichen | |||
131 | ƒ | Kleiner lateinischer Buchstabe f mit Haken | |||
132 | „ | Doppel-Low-9 Anführungszeichen | |||
133 | … | horizontal Auslassungs | |||
134 | † | Dolch | |||
135 | ‡ | Doppelkreuz | |||
136 | ˆ | Modifikator Brief Circumflex | |||
137 | ‰ | Promille-Zeichen | |||
138 | Š | Lateinischer Großbuchstabe S mit Caron | |||
139 | ‹ | Single nach links zeigender Winkel Anführungszeichen | |||
140 | Œ | Latin Kapitalbindung OE | |||
141 | NICHT BENUTZT | ||||
142 | Z | Lateinischer Großbuchstabe Z mit Caron | |||
143 | NICHT BENUTZT | ||||
144 | NICHT BENUTZT | ||||
145 | ‘ | linker Apostroph | |||
146 | ’ | Recht einfache Anführungszeichen | |||
147 | “ | links doppelte Anführungszeichen | |||
148 | ” | rechts doppelte Anführungszeichen | |||
149 | • | Kugel | |||
150 | – | en dash | |||
151 | — | EM Dash | |||
152 | ˜ | kleine Tilde | |||
153 | ™ | Markenzeichen | |||
154 | š | Kleiner lateinischer Buchstabe s mit Caron | |||
155 | › | Einzel rechte Richtungswinkel Anführungszeichen | |||
156 | œ | Kleine lateinische Ligatur oe | |||
157 | NICHT BENUTZT | ||||
158 | z | Kleiner lateinischer Buchstabe z mit Caron | |||
159 | Ÿ | Lateinischer Großbuchstabe Y mit Trema | |||
160 | No-Break Raum | ||||
161 | invertierte Ausrufezeichen | ||||
162 | ¢ | ¢ | ¢ | Cent-Zeichen | |
163 | £ | £ | £ | Pfund-Zeichen | |
164 | Währungszeichen | ||||
165 | ¥ | ¥ | ¥ | Yen-Zeichen | |
166 | ¦ | ¦ | ¦ | broken bar | |
167 | § | § | § | Abschnitt Zeichen | |
168 | ¨ | ¨ | ¨ | Trema | |
169 | © | © | © | Copyright-Zeichen | |
170 | ª | ª | ª | feminine Ordinalzeichen | |
171 | « | « | « | links zeigender Zitat Doppelwinkelmarke | |
172 | nicht unterschreiben | ||||
173 | | | | weicher Bindestrich | |
174 | ® | ® | ® | registrierte Zeichen | |
175 | ¯ | ¯ | ¯ | Längezeichen | |
176 | ° | ° | ° | Grad-Zeichen | |
177 | ± | ± | ± | Plus-Minus-Zeichen | |
178 | ² | ² | ² | Exponent zwei | |
179 | ³ | ³ | ³ | Exponent drei | |
180 | akut | ||||
181 | µ | µ | µ | Mikro-Zeichen | |
182 | Pilcrow Zeichen | ||||
183 | · | · | · | Mittelpunkt | |
184 | . | . | . | cedilla | |
185 | ª | ª | ª | Exponent ein | |
186 | männlich Ordinalzeichen | ||||
187 | » | » | » | rechte Zeigedoppelwinkel Anführungszeichen | |
188 | 1/4 | 1/4 | 1/4 | vulgäre Fraktion ein Viertel | |
189 | 1/2 | 1/2 | 1/2 | vulgäre Fraktion eine Hälfte | |
190 | 3/4 | 3/4 | 3/4 | vulgäre Fraktion drei Viertel | |
191 | umgekehrte Fragezeichen | ||||
192 | À | À | À | Lateinischer Großbuchstabe A mit Grab | |
193 | Á | Á | Á | Lateinischer Großbuchstabe A mit akutem | |
194 | Â | Â | Â | Lateinischer Großbuchstabe A mit Zirkumflex | |
195 | Ã | Ã | Ã | Lateinischer Großbuchstabe A mit Tilde | |
196 | Ä | Ä | Ä | Lateinischer Großbuchstabe A mit Trema | |
197 | Å | Å | Å | Lateinischer Großbuchstabe A mit Ring oben | |
198 | Æ | Æ | Æ | Lateinischer Großbuchstabe AE | |
199 | C | C | C | Lateinischer Großbuchstabe C mit Cedille | |
200 | E | E | E | Lateinischer Großbuchstabe E mit Gravis | |
201 | E | E | E | Lateinischer Großbuchstabe E mit akuten | |
202 | E | E | E | Lateinischer Großbuchstabe E mit Zirkumflex | |
203 | E | E | E | Lateinischer Großbuchstabe E mit Trema | |
204 | I | I | I | Lateinischer Großbuchstabe I mit Gravis | |
205 | I | I | I | Lateinischer Großbuchstabe I mit akutem | |
206 | I | I | I | Lateinischer Großbuchstabe I mit Zirkumflex | |
207 | I | I | I | Lateinischer Großbuchstabe I mit Trema | |
208 | Ð | Ð | Ð | Lateinischer Großbuchstabe Eth | |
209 | Ñ | Ñ | Ñ | Lateinischer Großbuchstabe N mit Tilde | |
210 | O | O | O | Lateinischer Großbuchstabe O mit Gravis | |
211 | O | O | O | Lateinischer Großbuchstabe O mit akutem | |
212 | O | O | O | Lateinischer Großbuchstabe O mit Zirkumflex | |
213 | O | O | O | Lateinischer Großbuchstabe O mit Tilde | |
214 | O | O | O | Lateinischer Großbuchstabe O mit Trema | |
215 | × | × | × | Multiplikationszeichen | |
216 | Ø | Ø | Ø | Lateinischer Großbuchstabe O mit Schlaganfall | |
217 | U | U | U | Lateinischer Großbuchstabe U mit Gravis | |
218 | U | U | U | Lateinischer Großbuchstabe U mit akutem | |
219 | U | U | U | Lateinischer Großbuchstabe U mit Zirkumflex | |
220 | U | U | U | Lateinischer Großbuchstabe U mit Trema | |
221 | Y | Y | Y | Lateinischer Großbuchstabe Y mit akutem | |
222 | Þ | Þ | Þ | Lateinischer Großbuchstabe Thorn | |
223 | ß | ß | ß | Kleiner lateinischer Buchstabe Eszett | |
224 | a | a | a | Kleiner lateinischer Buchstabe a mit Gravis | |
225 | a | a | a | Kleiner lateinischer Buchstabe a mit akuten | |
226 | a | a | a | Kleiner lateinischer Buchstabe a mit Zirkumflex | |
227 | a | a | a | Kleiner lateinischer Buchstabe a mit Tilde | |
228 | a | a | a | Kleiner lateinischer Buchstabe a mit Trema | |
229 | a | a | a | Kleiner lateinischer Buchstabe a mit Ring oben | |
230 | a | a | a | Kleiner lateinischer Buchstabe ae | |
231 | c | c | c | Kleiner lateinischer Buchstabe c mit Cedille | |
232 | e | e | e | Kleiner lateinischer Buchstabe e mit Gravis | |
233 | e | e | e | Kleiner lateinischer Buchstabe e mit akutem | |
234 | e | e | e | Kleiner lateinischer Buchstabe e mit Zirkumflex | |
235 | e | e | e | Kleiner lateinischer Buchstabe e mit Trema | |
236 | i | i | i | Kleiner lateinischer Buchstabe i mit Gravis | |
237 | i | i | i | Kleiner lateinischer Buchstabe i mit akuten | |
238 | i | i | i | Kleiner lateinischer Buchstabe i mit Zirkumflex | |
239 | i | i | i | Kleiner lateinischer Buchstabe i mit Trema | |
240 | Kleiner lateinischer Buchstabe eth | ||||
241 | n | n | n | Kleiner lateinischer Buchstabe n mit Tilde | |
242 | o | o | o | Kleiner lateinischer Buchstabe o mit Gravis | |
243 | o | o | o | Kleiner lateinischer Buchstabe o mit akuten | |
244 | o | o | o | Kleiner lateinischer Buchstabe o mit Zirkumflex | |
245 | o | o | o | Kleiner lateinischer Buchstabe o mit Tilde | |
246 | o | o | o | Kleiner lateinischer Buchstabe o mit Trema | |
247 | ÷ | ÷ | ÷ | Divisionszeichen | |
248 | Kleiner lateinischer Buchstabe o mit Schlaganfall | ||||
249 | u | u | u | Kleiner lateinischer Buchstabe u mit Gravis | |
250 | u | u | u | Kleiner lateinischer Buchstabe u mit akuten | |
251 | u | u | u | Kleiner lateinischer Buchstabe mit Zirkumflex | |
252 | u | u | u | Kleiner lateinischer Buchstabe u mit Trema | |
253 | y | y | y | Kleiner lateinischer Buchstabe y mit akuten | |
254 | þ | þ | þ | Kleiner lateinischer Buchstabe Dorn | |
255 | y | y | y | Kleiner lateinischer Buchstabe y mit Trema |
Der ASCII-Zeichensatz
ASCII verwendet die Werte von 0 bis 31 (and 127) für Steuerzeichen.
ASCII verwendet den Wert 32-126 für Buchstaben, Ziffern und Symbole.
ASCII nicht die Werte von 128 bis 255 verwenden.
Der ANSI - Zeichensatz (Windows-1252)
ANSI ist identisch für die Werte von 0 bis 127 in ASCII.
ANSI hat eine proprietäre Menge von Zeichen für die Werte von 128 bis 159.
ANSI ist identisch mit UTF-8 für die Werte von 160 bis 255.
Der ISO-8859-1-Zeichensatz
8859-1 ist identisch für die Werte von 0 bis 127 in ASCII.
8859-1 nicht die Werte von 128 bis 159 verwenden.
8859-1 ist identisch mit UTF-8 für die Werte von 160 bis 255.
Der UTF-8-Zeichensatz
UTF-8 ist identisch für die Werte von 0 bis 127 in ASCII.
UTF-8 nicht die Werte von 128 bis 159 verwenden.
UTF-8 ist identisch mit sowohl ANSI und 8859-1 für die Werte von 160 bis 255.
UTF-8 setzt sich von dem Wert 256 mit mehr als 10 000 verschiedene Zeichen.
Für einen genaueren Blick, unsere Studie der komplette HTML - Zeichensatz Referenz .