Neueste Web-Entwicklung Tutorials
 

Sets HTML Character


Um richtig eine HTML - Seite anzuzeigen, muss der Browser wissen , was Zeichensatz (character encoding) zu verwenden.


Sets HTML Character

Was ist die korrekte Zeichencodierung in HTML zu benutzen?

Für HTML5, ist die Standard - Zeichencodierung UTF-8.

Das ist nicht immer der Fall gewesen. Die Zeichencodierung für die frühe Bahn war ASCII.

Später von HTML 2.0, HTML 4.01, wurde ISO-8859-1 der Standard.

Mit XML und HTML5, UTF-8 endlich angekommen, und viele Zeichencodierung Probleme gelöst.

Nachfolgend finden Sie eine kurze Beschreibung der Zeichencodierungsstandards.


Am Anfang: ASCII

Computer Informationen (numbers, texts, and pictures) werden als binäre Einsen gespeichert und Nullen (01000101) in der Elektronik.

Um das Speichern von alphanumerischen Zeichen, der amerikanische Standard Code for Information Interchange zu standardisieren (ASCII) erstellt wurde. Es definiert eine eindeutige binäre 7-Bit - Nummer für jede speicherbare Zeichen die Zahlen von 0-9, die Groß- / Kleinschreibung englische Alphabet zu unterstützen (az, AZ) wie, und einige Sonderzeichen! $ + - ( ) @ <>.

Da ein Byte ASCII (7 Bits für den Charakter, und einer von Bit zur Steuerung Übertragungsparität) verwendet wird, könnte sie stellen nur 128 verschiedene Zeichen. Zusätzlich 32 dieser Zeichen wurden für andere Steuerungszwecke reserviert.

Die größte Schwäche mit ASCII war, dass es nicht englische Buchstaben ausgeschlossen.

ASCII ist noch heute weit verbreitet, vor allem in großen Mainframe-Computersystemen.

Für einen genaueren Blick, benutzen Sie bitte unser studieren komplette ASCII Referenz .


In Windows: ANSI

ANSI (also called Windows-1252) - (also called Windows-1252) war die Standardzeichen in Windows festgelegt, bis zu Windows 95.

ANSI ist eine Erweiterung ASCII, mit Zusatz von internationalen Zeichen. Es verwendet ein volles Byte (8-bits) 256 verschiedene Zeichen darzustellen.

Da ANSI das Standardzeichensatz in Windows wurde, wird es von allen Browsern unterstützt.

Für einen genaueren Blick, benutzen Sie bitte unser studieren komplette ANSI Referenz .


In HTML 4: ISO-8859-1

Da die meisten Länder außerhalb Zeichen ASCII verwenden, wurde die Standard-Zeichenkodierung in dem HTML-2.0-Standard ISO-8859-1 geändert.

ISO-8859-1 ist eine Erweiterung ASCII, mit Zusatz von internationalen Zeichen. Wie ANSI, verwendet er ein volles Byte doppelt so viele Zeichen als ASCII darzustellen.

Wenn Browser ISO-8859-1 in einer Web-Seite erkennen, Standard sie in der Regel zu ANSI, weil ANSI ISO-8859-1 mit Ausnahme identisch ist, dass ANSI 32 zusätzliche Zeichen.

Wenn ein HTML 4 Web - Seite einen anderen Zeichensatz als ISO 8859-1 verwendet, sollte sie in der angegeben werden <meta> wie tag:

Beispiel

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">

Der Standardzeichensatz für HTML5 ist UTF-8.
Alle HTML-4-Prozessoren unterstützen UTF-8, und alle HTML5 und XML-Prozessoren unterstützen sowohl UTF-8 und UTF-16.

Für einen genaueren Blick, benutzen Sie bitte unser studieren komplette ISO-8859-1 Referenz .


In HTML5: Unicode UTF-8

Da die Zeichensätze oben genannten begrenzt sind, und nicht kompatibel in multilingualen Umgebungen entwickelte das Unicode-Konsortium den Unicode-Standard.

Der Unicode - Standard deckt (almost) alle Zeichen, Interpunktionszeichen und Symbole in der Welt.

Unicode ermöglicht die Verarbeitung, Speicherung und Transport von Text, unabhängig von Plattform und Sprache.

Die Standardzeichencodierung in HTML5 ist UTF-8.

Für einen genaueren Blick, benutzen Sie bitte unsere studieren Vollständige Unicode - Referenz .