tutorial pengembangan web terbaru

HTML Encoding (Set Karakter)


Untuk menampilkan halaman HTML dengan benar, web browser harus tahu karakter set (character encoding) untuk digunakan.


Apa Character Encoding?

ASCII adalah yang pertama standar pengkodean karakter (juga disebut set karakter). Ini mendefinisikan 127 karakter alfanumerik yang berbeda yang dapat digunakan di internet.

HTML (Hypertext Markup Language) telah digunakan sejak 1991, tapi HTML 4.0 (Desember 1997) adalah versi standar pertama di mana karakter internasional diberi pengobatan cukup lengkap. Ketika dokumen HTML termasuk karakter khusus di luar jangkauan tujuh bit ASCII dua gol yang layak dipertimbangkan: integritas informasi ini, dan tampilan browser universal.

ASCII didukung angka (0-9) , huruf bahasa Inggris (AZ) , dan beberapa karakter khusus seperti ! $ + - ( ) @ < > ! $ + - ( ) @ < > .

ANSI (Windows-1252) adalah asli set karakter Windows. Ini didukung 256 kode karakter yang berbeda.

ISO-8859-1 adalah karakter default ditetapkan untuk HTML 4. Hal ini juga didukung 256 kode karakter yang berbeda.

Karena ANSI dan ISO yang terbatas, pengkodean karakter default diubah menjadi UTF-8 di HTML5.

UTF-8 (Unicode) mencakup hampir semua karakter dan simbol di dunia.

Semua HTML 4 prosesor juga mendukung UTF-8.


HTML charset Atribut

Untuk menampilkan halaman HTML dengan benar, web browser harus mengetahui set karakter yang digunakan di halaman.

Hal ini ditentukan dalam <meta> tag:

Untuk HTML4:

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

Untuk HTML5:

<meta charset="UTF-8">

Jika browser mendeteksi ISO-8859-1 di halaman web, standarnya ke ANSI, karena ANSI identik dengan ISO-8859-1 kecuali bahwa ANSI memiliki 32 karakter tambahan.


Perbedaan Antara Set Karakter

Tabel berikut menampilkan perbedaan antara set karakter yang dijelaskan di atas:

NumbASCIIANSI8859UTF-8 Deskripsi
32     ruang
33!!!! tanda seru
34"""" tanda kutip
35#### tanda nomor
36$$$$ tanda dollar
37%%%% tanda persen
38&&&& ampersand
39'''' apostrof
40(((( kurung kiri
41)))) kurung kanan
42**** asterisk
43++++ tanda tambah
44,,,, koma
45---- tanda hubung minus
46.... titik
47//// solidus
480000 digit nol
491111 digit satu
502222 digit dua
513333 digit tiga
524444 digit empat
535555 digit lima
546666 digit enam
557777 digit tujuh
568888 digit delapan
579999 digit sembilan
58:::: usus besar
59;;;; titik koma
60<<<< tanda kurang-dari
61==== tanda sama dengan
62>>>> lebih besar daripada tanda
63???? tanda tanya
64@@@@ komersial di
65AAAA Latin huruf A
66BBBB Latin huruf B
67CCCC huruf latin C
68DDDD huruf latin D
69EEEE huruf latin E
70FFFF huruf latin F
71GGGG huruf latin G
72HHHH huruf latin H
73IIII Latin huruf I
74JJJJ huruf latin J
75KKKK huruf latin K
76LLLL huruf latin L
77MMMM huruf latin M
78NNNN huruf latin N
79OOOO Latin huruf O
80PPPP huruf latin P
81QQQQ Latin huruf Q
82RRRR Latin huruf R
83SSSS huruf latin S
84TTTT huruf latin T
85UUUU huruf latin U
86VVVV Latin huruf V
87WWWW huruf latin W
88XXXX huruf latin X
89YYYY huruf latin Y
90ZZZZ Latin huruf Z
91[[[[ meninggalkan braket persegi
92\\\\ solidus terbalik
93]]]] braket persegi tepat
94^^^^ tanda sirkomfleks
95____ garis rendah
96```` aksen
97aaaa Latin kecil huruf a
98bbbb Latin kecil huruf b
99cccc Surat kecil latin c
100dddd Latin kecil huruf d
101eeee Latin kecil huruf e
102ffff Latin kecil huruf f
103gggg Latin kecil huruf g
104hhhh Latin kecil huruf h
105iiii Latin kecil huruf i
106jjjj Latin kecil huruf j
107kkkk Latin kecil huruf k
108llll Latin kecil huruf l
109mmmm Latin kecil huruf m
110nnnn Latin kecil surat n
111oooo Latin kecil huruf o
112pppp Latin kecil surat p
113qqqq Latin kecil huruf q
114rrrr Latin kecil surat r
115ssss Latin kecil surat s
116tttt Latin kecil surat t
117uuuu Surat kecil latin u
118vvvv Latin kecil surat v
119wwww Surat kecil latin w
120xxxx Latin kecil surat x
121yyyy Latin kecil surat y
122zzzz Latin kecil surat z
123{{{{ braket keriting kiri
124|||| garis vertikal
125}}}} braket keriting yang tepat
126~~~~ tilde
127DEL   
128    simbol euro
129     TIDAK DIGUNAKAN
130    single-9 rendah tanda kutip
131 ƒ   Surat kecil latin f dengan hook
132    ganda-9 rendah tanda kutip
133    elipsis horisontal
134    pisau belati
135    belati ganda
136 ˆ   Surat pengubah aksen sirkumfleksa
137    per sign mille
138 Š   Latin huruf S dengan aksen caron
139    tunggal sudut tanda kutip kiri-menunjuk
140 Œ   modal pengikat latin OE
141     TIDAK DIGUNAKAN
142 Z   Latin huruf Z dengan aksen caron
143     TIDAK DIGUNAKAN
144     TIDAK DIGUNAKAN
145    kiri tanda kutip tunggal
146    kanan tanda kutip tunggal
147    kiri tanda kutip ganda
148    kanan tanda kutip ganda
149    peluru
150    en dasbor
151    em dasbor
152 ˜   tilde kecil
153    merek dagang tanda
154 š   Surat kecil latin s dengan aksen caron
155    tunggal kanan menunjuk tanda kurung sudut
156 œ   Latin oe ligatur kecil
157     TIDAK DIGUNAKAN
158 z   Latin kecil surat z dengan aksen caron
159 Ÿ   huruf latin Y dengan aksen diaeresis
160     ada-break ruang
161     tanda seru terbalik
162 ¢¢¢ tanda sen
163 £££ tanda pound
164     tanda mata uang
165 ¥¥¥ tanda yen
166 ¦¦¦ patah bar
167 §§§ bagian tanda
168 ¨¨¨ tanda titik dua di atas huruf suara
169 ©©© tanda hak cipta
170 ªªª Indikator ordinal feminin
171 ««« kiri menunjuk sudut ganda tanda kutip
172     tidak menandatangani
173 ­­­ tanda hubung lembut
174 ®®® tanda terdaftar
175 ¯¯¯ garis makron
176 °°° tanda derajat
177 ±±± plus-minus tanda
178 ²²² superscript dua
179 ³³³ superscript tiga
180     aksen akut
181 µµµ mikro tanda
182     tanda Pilcrow
183 ··· tengah dot
184 ... cedilla
185 ªªª satu superscript
186     Indikator ordinal maskulin
187 »»» benar-menunjuk dua sudut tanda kutip
188 1/41/41/4 vulgar fraksi seperempat
189 1/21/21/2 vulgar fraksi satu setengah
190 3/43/43/4 vulgar fraksi tiga perempat
191     tanda tanya terbalik
192 ÀÀÀ Latin huruf A dengan kuburan
193 ÁÁÁ Latin huruf A dengan akut
194 ÂÂÂ Latin huruf A dengan sirkumfleksa
195 ÃÃÃ Latin huruf A dengan tilde
196 ÄÄÄ Latin huruf A dengan aksen diaeresis
197 ÅÅÅ Latin huruf A dengan cincin di atas
198 ÆÆÆ huruf latin AE
199 CCC Latin huruf C dengan cedilla
200 EEE Latin huruf E dengan kuburan
201 EEE Latin huruf E dengan akut
202 EEE Latin huruf E dengan sirkumfleksa
203 EEE Latin huruf E dengan aksen diaeresis
204 III huruf latin I dengan kuburan
205 III huruf latin I dengan akut
206 III huruf latin I dengan sirkumfleksa
207 III huruf latin I dengan aksen diaeresis
208 ÐÐÐ huruf latin Eth
209 ÑÑÑ Latin huruf N dengan tilde
210 OOO Latin huruf O dengan kuburan
211 OOO Latin huruf O dengan akut
212 OOO Latin huruf O dengan sirkumfleksa
213 OOO Latin huruf O dengan tilde
214 OOO Latin huruf O dengan aksen diaeresis
215 ××× tanda perkalian
216 ØØØ Latin huruf O stroke
217 UUU huruf latin U dengan kuburan
218 UUU huruf latin U dengan akut
219 UUU huruf latin U dengan sirkumfleksa
220 UUU huruf latin U dengan aksen diaeresis
221 YYY huruf latin Y dengan akut
222 ÞÞÞ Latin huruf kapital Thorn
223 ßßß Surat kecil latin s tajam
224 aaa Latin kecil surat dengan kuburan
225 aaa Latin kecil surat dengan akut
226 aaa Latin kecil surat dengan sirkumfleksa
227 aaa Latin kecil surat dengan tilde
228 aaa Latin kecil surat dengan aksen diaeresis
229 aaa Latin kecil surat dengan cincin di atas
230 aaa Latin kecil surat ae
231 ccc Surat kecil latin c dengan cedilla
232 eee Latin kecil huruf e dengan kuburan
233 eee Latin kecil huruf e dengan akut
234 eee Latin kecil huruf e dengan sirkumfleksa
235 eee Latin kecil huruf e dengan aksen diaeresis
236 iii Surat kecil latin i dengan kuburan
237 iii Surat kecil latin i dengan akut
238 iii Surat kecil latin i dengan sirkumfleksa
239 iii Surat kecil latin i dengan aksen diaeresis
240     Latin kecil surat eth
241 nnn Latin kecil surat n dengan tilde
242 ooo Surat kecil latin o dengan kuburan
243 ooo Surat kecil latin o dengan akut
244 ooo Surat kecil latin o dengan sirkumfleksa
245 ooo Surat kecil latin o dengan tilde
246 ooo Surat kecil latin o dengan aksen diaeresis
247 ÷÷÷ tanda bagi
248     Surat kecil latin o stroke
249 uuu Surat kecil latin u dengan kuburan
250 uuu Surat kecil latin u dengan akut
251 uuu Surat kecil latin dengan sirkumfleksa
252 uuu Surat kecil latin u dengan aksen diaeresis
253 yyy Latin kecil surat y dengan akut
254 þþþ Latin kecil surat duri
255 yyy Latin kecil surat y dengan aksen diaeresis

ASCII Character Set

ASCII menggunakan nilai 0-31 (and 127) untuk karakter kontrol.

ASCII menggunakan nilai 32-126 untuk huruf, angka, dan simbol.

ASCII tidak menggunakan nilai-nilai 128-255.


ANSI Character Set (Windows-1252)

ANSI identik dengan ASCII untuk nilai 0-127.

ANSI memiliki sekumpulan karakter untuk nilai 128-159.

ANSI identik dengan UTF-8 untuk nilai 160-255.


ISO-8859-1 Set Karakter

8859-1 identik dengan ASCII untuk nilai 0-127.

8859-1 tidak menggunakan nilai-nilai 128-159.

8859-1 identik dengan UTF-8 untuk nilai 160-255.


UTF-8 Character Set

UTF-8 identik dengan ASCII untuk nilai 0-127.

UTF-8 tidak menggunakan nilai-nilai 128-159.

UTF-8 identik dengan baik ANSI dan 8859-1 untuk nilai 160-255.

UTF-8 terus dari nilai 256 dengan lebih dari 10 000 karakter yang berbeda.

Untuk melihat lebih dekat, belajar kami Lengkap HTML Character Set Referensi .