Neueste Web-Entwicklung Tutorials
 

Sets HTML-Zeichen


Um richtig eine HTML-Seite anzuzeigen, muss der Browser wissen, was Zeichensatz (Zeichencodierung) zu verwenden.


Sets HTML-Zeichen

Was ist die richtige Zeichencodierung in HTML zu benutzen?

Für HTML5 ist die Standard - Zeichenkodierung UTF-8.

Das war nicht immer der Fall gewesen. Die Zeichencodierung für die frühe Bahn war ASCII.

Später von HTML 2.0 in HTML 4.01, wurde ISO-8859-1 der Standard.

Mit XML und HTML5, UTF-8 endlich angekommen, und eine Menge von Zeichencodierung Probleme gelöst.

Nachfolgend finden Sie eine kurze Beschreibung der Zeichencodierungsstandards.


Am Anfang: ASCII

Computer-Informationen (Zahlen, Texte und Bilder) als binäre Einsen gespeichert und Nullen (01000101) in der Elektronik.

Um das Speichern von alphanumerischen Zeichen, die amerikanische Standard Code for Information Interchange (ASCII) standardisieren erstellt wurde. Es definiert eine eindeutige binäre 7-Bit-Nummer für jede speicherbare Zeichen wie die Zahlen von 0-9, die Groß- / Kleinschreibung englische Alphabet (az, AZ), und einige Sonderzeichen zu unterstützen! $ + - () @ <>.

Da ASCII ein Byte (7 Bits für den Charakter, und einer von Bit zur Steuerung Übertragungs parity) verwendet wird, könnte es stellen nur 128 verschiedene Zeichen. Darüber hinaus 32 dieser Zeichen wurden für andere Steuerungszwecke reserviert.

Die größte Schwäche mit ASCII war, dass es nicht englische Buchstaben ausgeschlossen.

ASCII ist noch heute weit verbreitet, insbesondere in großen Mainframe-Computersystemen.

Für einen genaueren Blick, benutzen Sie bitte unser studieren komplette ASCII Referenz .


In Windows: ANSI

ANSI (auch als Windows-1252) war der Standardzeichen in Windows festgelegt, bis zu Windows 95.

ANSI ist eine Erweiterung ASCII, mit Zusatz von internationalen Zeichen. Es verwendet ein volles Byte (8-Bit) 256 verschiedene Zeichen darzustellen.

Da ANSI das Standardzeichensatz in Windows wurde, wird es von allen Browsern unterstützt.

Für einen genaueren Blick, benutzen Sie bitte unser studieren komplette ANSI Referenz .


In HTML 4: ISO-8859-1

Da die meisten Länder außerhalb Zeichen ASCII verwenden, wurde die Standard-Zeichenkodierung in der HTML-2.0-Standard ISO-8859-1 geändert.

ISO-8859-1 ist eine Erweiterung ASCII, mit Zusatz von internationalen Zeichen. Wie ANSI, verwendet es ein volles Byte doppelt so viele Zeichen als ASCII zu repräsentieren.

Hinweis Wenn Browser ISO-8859-1 in einer Web-Seite erkennen, Standard sie in der Regel nach ANSI, weil ANSI ISO-8859-1 mit Ausnahme identisch ist, dass ANSI 32 zusätzliche Zeichen hat.

Wenn ein HTML 4 Web - Seite einen anderen Zeichensatz als ISO-8859-1 verwendet, sollte es in der angegeben werden <meta> tag:

Beispiel

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">
Versuch es selber "

Hinweis

Der Standardzeichensatz für HTML5 ist UTF-8.
Alle HTML-4-Prozessoren unterstützen UTF-8, und alle HTML5 und XML-Prozessoren unterstützen sowohl UTF-8 und UTF-16.

Für einen genaueren Blick, benutzen Sie bitte unser studieren komplette ISO-8859-1 Referenz .


In HTML5: Unicode UTF-8

Da die Zeichensätze oben aufgeführten beschränkt sind, und nicht kompatibel in multilingualen Umgebungen entwickelte das Unicode-Konsortium den Unicode-Standard.

Der Unicode-Standard deckt (fast) alle Zeichen, Interpunktionszeichen und Symbole in der Welt.

Unicode ermöglicht die Verarbeitung, Speicherung und Transport von Text, unabhängig von Plattform und Sprache.

Der Standard - Zeichenkodierung in HTML5 ist UTF-8.

Für einen genaueren Blick, benutzen Sie bitte unser studieren Vollständige Unicode - Referenz .