Neueste Web-Entwicklung Tutorials

HTML-Codierung (Zeichensätze)


Um eine HTML - Seite angezeigt wird ein Web - Browser muss korrekt, kennt den Zeichensatz (character encoding) zu verwenden.


Was ist Zeichenkodierung?

ASCII war der erste Zeichencodierungsstandard (auch Zeichensatz genannt). Es definiert 127 verschiedene alphanumerische Zeichen, die im Internet verwendet werden könnten.

HTML (Hypertext Markup Language) ist seit 1991 im Einsatz, aber HTML 4.0 (Dezember 1997) war die erste standardisierte Version, wo internationale Zeichen waren recht vollständige Behandlung. Wenn ein HTML-Dokument außerhalb des Bereichs von sieben-Bit-ASCII-Sonderzeichen enthält zwei Ziele sind eine Überlegung wert: die Integrität der Informationen und Universal-Browser-Anzeige.

ASCII unterstützt Zahlen (0-9) , englische Buchstaben (AZ) und einige Sonderzeichen wie ! $ + - ( ) @ < > ! $ + - ( ) @ < > .

ANSI (Windows-1252) war der ursprüngliche Windows - Zeichensatz. Es unterstützt 256 verschiedene Zeichencodes.

ISO-8859-1 war der Standardzeichensatz für HTML 4. Es unterstützt auch 256 verschiedene Zeichencodes.

Da ANSI und ISO begrenzt waren, wurde die Standard-Zeichenkodierung UTF-8 in HTML5 verändert.

UTF-8 (Unicode) deckt fast alle Zeichen und Symbole in der Welt.

Alle HTML-4-Prozessoren unterstützen auch UTF-8.


Das HTML-Attribut charset

Um richtig eine HTML-Seite angezeigt wird, ein Web-Browser muss den Zeichensatz kennt auf der Seite verwendet.

Dies wird in dem angegebenen <meta> tag:

Für HTML4:

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

Für HTML5:

<meta charset="UTF-8">

Wenn ein Browser ISO-8859-1 in einer Web-Seite erkennt, wird standardmäßig ANSI, weil ANSI ist identisch mit ISO-8859-1, außer dass ANSI 32 zusätzliche Zeichen.


Unterschiede zwischen Zeichensätze

Die folgende Tabelle zeigt die Unterschiede zwischen den Zeichensätzen oben beschrieben:

NumbASCIIANSI8859UTF-8 Beschreibung
32     Platz
33!!!! Ausrufezeichen
34"""" Anführungszeichen
35#### Nummernschild
36$$$$ Dollarzeichen
37%%%% Prozentzeichen
38&&&& Et-Zeichen
39'''' Apostroph
40(((( Klammer auf
41)))) ende Klammer
42**** Sternchen
43++++ Pluszeichen
44,,,, Komma
45---- Bindestrich-Minus
46.... Punkt
47//// Solidus
480000 Ziffer Null
491111 Ziffer eins
502222 Ziffer zwei
513333 Ziffer drei
524444 Ziffer vier
535555 Ziffer fünf
546666 Ziffer sechs
557777 Ziffer sieben
568888 Ziffer acht
579999 Ziffer neun
58:::: Doppelpunkt
59;;;; Semikolon
60<<<< weniger-als-Zeichen
61==== Gleichheitszeichen
62>>>> Größer-als-Zeichen
63???? Fragezeichen
64@@@@ commercial at
65AAAA Lateinischer Großbuchstabe A
66BBBB Lateinischer Großbuchstabe B
67CCCC Lateinischer Großbuchstabe C
68DDDD Lateinischer Großbuchstabe D
69EEEE Lateinischer Großbuchstabe E
70FFFF Lateinischer Großbuchstabe F
71GGGG Lateinischer Großbuchstabe G
72HHHH Lateinischer Großbuchstabe H
73IIII Lateinischer Großbuchstabe I
74JJJJ Lateinischer Großbuchstabe J
75KKKK Lateinischer Großbuchstabe K
76LLLL Lateinischer Großbuchstabe L
77MMMM Lateinischer Großbuchstabe M
78NNNN Lateinischer Großbuchstabe N
79OOOO Lateinischer Großbuchstabe O
80PPPP Lateinischer Großbuchstabe P
81QQQQ Lateinischer Großbuchstabe Q
82RRRR Lateinischer Großbuchstabe R
83SSSS Lateinischer Großbuchstabe S
84TTTT Lateinischer Großbuchstabe T
85UUUU Lateinischer Großbuchstabe U
86VVVV Lateinischer Großbuchstabe V
87WWWW Lateinischer Großbuchstabe W
88XXXX Lateinischer Großbuchstabe X
89YYYY Lateinischer Großbuchstabe Y
90ZZZZ Lateinischer Großbuchstabe Z
91[[[[ eckige Klammer
92\\\\ Reverse-Solidus
93]]]] eckige Klammer
94^^^^ Circumflex
95____ bodennah
96```` Gravis
97aaaa Kleiner lateinischer Buchstabe a
98bbbb Kleiner lateinischer Buchstabe b
99cccc Kleiner lateinischer Buchstabe c
100dddd Kleiner lateinischer Buchstabe d
101eeee Kleiner lateinischer Buchstabe e
102ffff Kleiner lateinischer Buchstabe f
103gggg Kleiner lateinischer Buchstabe g
104hhhh Kleiner lateinischer Buchstabe h
105iiii Kleiner lateinischer Buchstabe i
106jjjj Kleiner lateinischer Buchstabe j
107kkkk Kleiner lateinischer Buchstabe k
108llll Kleiner lateinischer Buchstabe l
109mmmm Kleiner lateinischer Buchstabe m
110nnnn Kleiner lateinischer Buchstabe n
111oooo Kleiner lateinischer Buchstabe o
112pppp Kleiner lateinischer Buchstabe p
113qqqq Kleiner lateinischer Buchstabe q
114rrrr Kleiner lateinischer Buchstabe r
115ssss Kleiner lateinischer Buchstabe s
116tttt Kleiner lateinischer Buchstabe t
117uuuu Kleiner lateinischer Buchstabe u
118vvvv Kleiner lateinischer Buchstabe v
119wwww Kleiner lateinischer Buchstabe w
120xxxx Kleiner lateinischer Buchstabe x
121yyyy Kleiner lateinischer Buchstabe y
122zzzz Kleiner lateinischer Buchstabe z
123{{{{ linke geschweifte Klammer
124|||| vertikale Linie
125}}}} geschweifte Klammer
126~~~~ Tilde
127DEL   
128    Euro-Zeichen
129     NICHT BENUTZT
130    einzige Low-9 Anführungszeichen
131 ƒ   Kleiner lateinischer Buchstabe f mit Haken
132    Doppel-Low-9 Anführungszeichen
133    horizontal Auslassungs
134    Dolch
135    Doppelkreuz
136 ˆ   Modifikator Brief Circumflex
137    Promille-Zeichen
138 Š   Lateinischer Großbuchstabe S mit Caron
139    Single nach links zeigender Winkel Anführungszeichen
140 Œ   Latin Kapitalbindung OE
141     NICHT BENUTZT
142 Z   Lateinischer Großbuchstabe Z mit Caron
143     NICHT BENUTZT
144     NICHT BENUTZT
145    linker Apostroph
146    Recht einfache Anführungszeichen
147    links doppelte Anführungszeichen
148    rechts doppelte Anführungszeichen
149    Kugel
150    en dash
151    EM Dash
152 ˜   kleine Tilde
153    Markenzeichen
154 š   Kleiner lateinischer Buchstabe s mit Caron
155    Einzel rechte Richtungswinkel Anführungszeichen
156 œ   Kleine lateinische Ligatur oe
157     NICHT BENUTZT
158 z   Kleiner lateinischer Buchstabe z mit Caron
159 Ÿ   Lateinischer Großbuchstabe Y mit Trema
160     No-Break Raum
161     invertierte Ausrufezeichen
162 ¢¢¢ Cent-Zeichen
163 £££ Pfund-Zeichen
164     Währungszeichen
165 ¥¥¥ Yen-Zeichen
166 ¦¦¦ broken bar
167 §§§ Abschnitt Zeichen
168 ¨¨¨ Trema
169 ©©© Copyright-Zeichen
170 ªªª feminine Ordinalzeichen
171 ««« links zeigender Zitat Doppelwinkelmarke
172     nicht unterschreiben
173 ­­­ weicher Bindestrich
174 ®®® registrierte Zeichen
175 ¯¯¯ Längezeichen
176 °°° Grad-Zeichen
177 ±±± Plus-Minus-Zeichen
178 ²²² Exponent zwei
179 ³³³ Exponent drei
180     akut
181 µµµ Mikro-Zeichen
182     Pilcrow Zeichen
183 ··· Mittelpunkt
184 ... cedilla
185 ªªª Exponent ein
186     männlich Ordinalzeichen
187 »»» rechte Zeigedoppelwinkel Anführungszeichen
188 1/41/41/4 vulgäre Fraktion ein Viertel
189 1/21/21/2 vulgäre Fraktion eine Hälfte
190 3/43/43/4 vulgäre Fraktion drei Viertel
191     umgekehrte Fragezeichen
192 ÀÀÀ Lateinischer Großbuchstabe A mit Grab
193 ÁÁÁ Lateinischer Großbuchstabe A mit akutem
194 ÂÂÂ Lateinischer Großbuchstabe A mit Zirkumflex
195 ÃÃÃ Lateinischer Großbuchstabe A mit Tilde
196 ÄÄÄ Lateinischer Großbuchstabe A mit Trema
197 ÅÅÅ Lateinischer Großbuchstabe A mit Ring oben
198 ÆÆÆ Lateinischer Großbuchstabe AE
199 CCC Lateinischer Großbuchstabe C mit Cedille
200 EEE Lateinischer Großbuchstabe E mit Gravis
201 EEE Lateinischer Großbuchstabe E mit akuten
202 EEE Lateinischer Großbuchstabe E mit Zirkumflex
203 EEE Lateinischer Großbuchstabe E mit Trema
204 III Lateinischer Großbuchstabe I mit Gravis
205 III Lateinischer Großbuchstabe I mit akutem
206 III Lateinischer Großbuchstabe I mit Zirkumflex
207 III Lateinischer Großbuchstabe I mit Trema
208 ÐÐÐ Lateinischer Großbuchstabe Eth
209 ÑÑÑ Lateinischer Großbuchstabe N mit Tilde
210 OOO Lateinischer Großbuchstabe O mit Gravis
211 OOO Lateinischer Großbuchstabe O mit akutem
212 OOO Lateinischer Großbuchstabe O mit Zirkumflex
213 OOO Lateinischer Großbuchstabe O mit Tilde
214 OOO Lateinischer Großbuchstabe O mit Trema
215 ××× Multiplikationszeichen
216 ØØØ Lateinischer Großbuchstabe O mit Schlaganfall
217 UUU Lateinischer Großbuchstabe U mit Gravis
218 UUU Lateinischer Großbuchstabe U mit akutem
219 UUU Lateinischer Großbuchstabe U mit Zirkumflex
220 UUU Lateinischer Großbuchstabe U mit Trema
221 YYY Lateinischer Großbuchstabe Y mit akutem
222 ÞÞÞ Lateinischer Großbuchstabe Thorn
223 ßßß Kleiner lateinischer Buchstabe Eszett
224 aaa Kleiner lateinischer Buchstabe a mit Gravis
225 aaa Kleiner lateinischer Buchstabe a mit akuten
226 aaa Kleiner lateinischer Buchstabe a mit Zirkumflex
227 aaa Kleiner lateinischer Buchstabe a mit Tilde
228 aaa Kleiner lateinischer Buchstabe a mit Trema
229 aaa Kleiner lateinischer Buchstabe a mit Ring oben
230 aaa Kleiner lateinischer Buchstabe ae
231 ccc Kleiner lateinischer Buchstabe c mit Cedille
232 eee Kleiner lateinischer Buchstabe e mit Gravis
233 eee Kleiner lateinischer Buchstabe e mit akutem
234 eee Kleiner lateinischer Buchstabe e mit Zirkumflex
235 eee Kleiner lateinischer Buchstabe e mit Trema
236 iii Kleiner lateinischer Buchstabe i mit Gravis
237 iii Kleiner lateinischer Buchstabe i mit akuten
238 iii Kleiner lateinischer Buchstabe i mit Zirkumflex
239 iii Kleiner lateinischer Buchstabe i mit Trema
240     Kleiner lateinischer Buchstabe eth
241 nnn Kleiner lateinischer Buchstabe n mit Tilde
242 ooo Kleiner lateinischer Buchstabe o mit Gravis
243 ooo Kleiner lateinischer Buchstabe o mit akuten
244 ooo Kleiner lateinischer Buchstabe o mit Zirkumflex
245 ooo Kleiner lateinischer Buchstabe o mit Tilde
246 ooo Kleiner lateinischer Buchstabe o mit Trema
247 ÷÷÷ Divisionszeichen
248     Kleiner lateinischer Buchstabe o mit Schlaganfall
249 uuu Kleiner lateinischer Buchstabe u mit Gravis
250 uuu Kleiner lateinischer Buchstabe u mit akuten
251 uuu Kleiner lateinischer Buchstabe mit Zirkumflex
252 uuu Kleiner lateinischer Buchstabe u mit Trema
253 yyy Kleiner lateinischer Buchstabe y mit akuten
254 þþþ Kleiner lateinischer Buchstabe Dorn
255 yyy Kleiner lateinischer Buchstabe y mit Trema

Der ASCII-Zeichensatz

ASCII verwendet die Werte von 0 bis 31 (and 127) für Steuerzeichen.

ASCII verwendet den Wert 32-126 für Buchstaben, Ziffern und Symbole.

ASCII nicht die Werte von 128 bis 255 verwenden.


Der ANSI - Zeichensatz (Windows-1252)

ANSI ist identisch für die Werte von 0 bis 127 in ASCII.

ANSI hat eine proprietäre Menge von Zeichen für die Werte von 128 bis 159.

ANSI ist identisch mit UTF-8 für die Werte von 160 bis 255.


Der ISO-8859-1-Zeichensatz

8859-1 ist identisch für die Werte von 0 bis 127 in ASCII.

8859-1 nicht die Werte von 128 bis 159 verwenden.

8859-1 ist identisch mit UTF-8 für die Werte von 160 bis 255.


Der UTF-8-Zeichensatz

UTF-8 ist identisch für die Werte von 0 bis 127 in ASCII.

UTF-8 nicht die Werte von 128 bis 159 verwenden.

UTF-8 ist identisch mit sowohl ANSI und 8859-1 für die Werte von 160 bis 255.

UTF-8 setzt sich von dem Wert 256 mit mehr als 10 000 verschiedene Zeichen.

Für einen genaueren Blick, unsere Studie der komplette HTML - Zeichensatz Referenz .