Untuk menampilkan halaman HTML dengan benar, web browser harus tahu karakter set (character encoding) untuk digunakan.
Apa Character Encoding?
ASCII adalah yang pertama standar pengkodean karakter (juga disebut set karakter). Ini mendefinisikan 127 karakter alfanumerik yang berbeda yang dapat digunakan di internet.
HTML (Hypertext Markup Language) telah digunakan sejak 1991, tapi HTML 4.0 (Desember 1997) adalah versi standar pertama di mana karakter internasional diberi pengobatan cukup lengkap. Ketika dokumen HTML termasuk karakter khusus di luar jangkauan tujuh bit ASCII dua gol yang layak dipertimbangkan: integritas informasi ini, dan tampilan browser universal.
ASCII didukung angka (0-9) , huruf bahasa Inggris (AZ) , dan beberapa karakter khusus seperti ! $ + - ( ) @ < > ! $ + - ( ) @ < > .
ANSI (Windows-1252) adalah asli set karakter Windows. Ini didukung 256 kode karakter yang berbeda.
ISO-8859-1 adalah karakter default ditetapkan untuk HTML 4. Hal ini juga didukung 256 kode karakter yang berbeda.
Karena ANSI dan ISO yang terbatas, pengkodean karakter default diubah menjadi UTF-8 di HTML5.
UTF-8 (Unicode) mencakup hampir semua karakter dan simbol di dunia.
Semua HTML 4 prosesor juga mendukung UTF-8.
HTML charset Atribut
Untuk menampilkan halaman HTML dengan benar, web browser harus mengetahui set karakter yang digunakan di halaman.
Hal ini ditentukan dalam <meta> tag:
Untuk HTML4:
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
Untuk HTML5:
<meta charset="UTF-8">
Jika browser mendeteksi ISO-8859-1 di halaman web, standarnya ke ANSI, karena ANSI identik dengan ISO-8859-1 kecuali bahwa ANSI memiliki 32 karakter tambahan.
Perbedaan Antara Set Karakter
Tabel berikut menampilkan perbedaan antara set karakter yang dijelaskan di atas:
Numb | ASCII | ANSI | 8859 | UTF-8 | Deskripsi |
---|---|---|---|---|---|
32 | ruang | ||||
33 | ! | ! | ! | ! | tanda seru |
34 | " | " | " | " | tanda kutip |
35 | # | # | # | # | tanda nomor |
36 | $ | $ | $ | $ | tanda dollar |
37 | % | % | % | % | tanda persen |
38 | & | & | & | & | ampersand |
39 | ' | ' | ' | ' | apostrof |
40 | ( | ( | ( | ( | kurung kiri |
41 | ) | ) | ) | ) | kurung kanan |
42 | * | * | * | * | asterisk |
43 | + | + | + | + | tanda tambah |
44 | , | , | , | , | koma |
45 | - | - | - | - | tanda hubung minus |
46 | . | . | . | . | titik |
47 | / | / | / | / | solidus |
48 | 0 | 0 | 0 | 0 | digit nol |
49 | 1 | 1 | 1 | 1 | digit satu |
50 | 2 | 2 | 2 | 2 | digit dua |
51 | 3 | 3 | 3 | 3 | digit tiga |
52 | 4 | 4 | 4 | 4 | digit empat |
53 | 5 | 5 | 5 | 5 | digit lima |
54 | 6 | 6 | 6 | 6 | digit enam |
55 | 7 | 7 | 7 | 7 | digit tujuh |
56 | 8 | 8 | 8 | 8 | digit delapan |
57 | 9 | 9 | 9 | 9 | digit sembilan |
58 | : | : | : | : | usus besar |
59 | ; | ; | ; | ; | titik koma |
60 | < | < | < | < | tanda kurang-dari |
61 | = | = | = | = | tanda sama dengan |
62 | > | > | > | > | lebih besar daripada tanda |
63 | ? | ? | ? | ? | tanda tanya |
64 | @ | @ | @ | @ | komersial di |
65 | A | A | A | A | Latin huruf A |
66 | B | B | B | B | Latin huruf B |
67 | C | C | C | C | huruf latin C |
68 | D | D | D | D | huruf latin D |
69 | E | E | E | E | huruf latin E |
70 | F | F | F | F | huruf latin F |
71 | G | G | G | G | huruf latin G |
72 | H | H | H | H | huruf latin H |
73 | I | I | I | I | Latin huruf I |
74 | J | J | J | J | huruf latin J |
75 | K | K | K | K | huruf latin K |
76 | L | L | L | L | huruf latin L |
77 | M | M | M | M | huruf latin M |
78 | N | N | N | N | huruf latin N |
79 | O | O | O | O | Latin huruf O |
80 | P | P | P | P | huruf latin P |
81 | Q | Q | Q | Q | Latin huruf Q |
82 | R | R | R | R | Latin huruf R |
83 | S | S | S | S | huruf latin S |
84 | T | T | T | T | huruf latin T |
85 | U | U | U | U | huruf latin U |
86 | V | V | V | V | Latin huruf V |
87 | W | W | W | W | huruf latin W |
88 | X | X | X | X | huruf latin X |
89 | Y | Y | Y | Y | huruf latin Y |
90 | Z | Z | Z | Z | Latin huruf Z |
91 | [ | [ | [ | [ | meninggalkan braket persegi |
92 | \ | \ | \ | \ | solidus terbalik |
93 | ] | ] | ] | ] | braket persegi tepat |
94 | ^ | ^ | ^ | ^ | tanda sirkomfleks |
95 | _ | _ | _ | _ | garis rendah |
96 | ` | ` | ` | ` | aksen |
97 | a | a | a | a | Latin kecil huruf a |
98 | b | b | b | b | Latin kecil huruf b |
99 | c | c | c | c | Surat kecil latin c |
100 | d | d | d | d | Latin kecil huruf d |
101 | e | e | e | e | Latin kecil huruf e |
102 | f | f | f | f | Latin kecil huruf f |
103 | g | g | g | g | Latin kecil huruf g |
104 | h | h | h | h | Latin kecil huruf h |
105 | i | i | i | i | Latin kecil huruf i |
106 | j | j | j | j | Latin kecil huruf j |
107 | k | k | k | k | Latin kecil huruf k |
108 | l | l | l | l | Latin kecil huruf l |
109 | m | m | m | m | Latin kecil huruf m |
110 | n | n | n | n | Latin kecil surat n |
111 | o | o | o | o | Latin kecil huruf o |
112 | p | p | p | p | Latin kecil surat p |
113 | q | q | q | q | Latin kecil huruf q |
114 | r | r | r | r | Latin kecil surat r |
115 | s | s | s | s | Latin kecil surat s |
116 | t | t | t | t | Latin kecil surat t |
117 | u | u | u | u | Surat kecil latin u |
118 | v | v | v | v | Latin kecil surat v |
119 | w | w | w | w | Surat kecil latin w |
120 | x | x | x | x | Latin kecil surat x |
121 | y | y | y | y | Latin kecil surat y |
122 | z | z | z | z | Latin kecil surat z |
123 | { | { | { | { | braket keriting kiri |
124 | | | | | | | | | garis vertikal |
125 | } | } | } | } | braket keriting yang tepat |
126 | ~ | ~ | ~ | ~ | tilde |
127 | DEL | ||||
128 | € | simbol euro | |||
129 | TIDAK DIGUNAKAN | ||||
130 | ‚ | single-9 rendah tanda kutip | |||
131 | ƒ | Surat kecil latin f dengan hook | |||
132 | „ | ganda-9 rendah tanda kutip | |||
133 | … | elipsis horisontal | |||
134 | † | pisau belati | |||
135 | ‡ | belati ganda | |||
136 | ˆ | Surat pengubah aksen sirkumfleksa | |||
137 | ‰ | per sign mille | |||
138 | Š | Latin huruf S dengan aksen caron | |||
139 | ‹ | tunggal sudut tanda kutip kiri-menunjuk | |||
140 | Œ | modal pengikat latin OE | |||
141 | TIDAK DIGUNAKAN | ||||
142 | Z | Latin huruf Z dengan aksen caron | |||
143 | TIDAK DIGUNAKAN | ||||
144 | TIDAK DIGUNAKAN | ||||
145 | ‘ | kiri tanda kutip tunggal | |||
146 | ’ | kanan tanda kutip tunggal | |||
147 | “ | kiri tanda kutip ganda | |||
148 | ” | kanan tanda kutip ganda | |||
149 | • | peluru | |||
150 | – | en dasbor | |||
151 | — | em dasbor | |||
152 | ˜ | tilde kecil | |||
153 | ™ | merek dagang tanda | |||
154 | š | Surat kecil latin s dengan aksen caron | |||
155 | › | tunggal kanan menunjuk tanda kurung sudut | |||
156 | œ | Latin oe ligatur kecil | |||
157 | TIDAK DIGUNAKAN | ||||
158 | z | Latin kecil surat z dengan aksen caron | |||
159 | Ÿ | huruf latin Y dengan aksen diaeresis | |||
160 | ada-break ruang | ||||
161 | tanda seru terbalik | ||||
162 | ¢ | ¢ | ¢ | tanda sen | |
163 | £ | £ | £ | tanda pound | |
164 | tanda mata uang | ||||
165 | ¥ | ¥ | ¥ | tanda yen | |
166 | ¦ | ¦ | ¦ | patah bar | |
167 | § | § | § | bagian tanda | |
168 | ¨ | ¨ | ¨ | tanda titik dua di atas huruf suara | |
169 | © | © | © | tanda hak cipta | |
170 | ª | ª | ª | Indikator ordinal feminin | |
171 | « | « | « | kiri menunjuk sudut ganda tanda kutip | |
172 | tidak menandatangani | ||||
173 | | | | tanda hubung lembut | |
174 | ® | ® | ® | tanda terdaftar | |
175 | ¯ | ¯ | ¯ | garis makron | |
176 | ° | ° | ° | tanda derajat | |
177 | ± | ± | ± | plus-minus tanda | |
178 | ² | ² | ² | superscript dua | |
179 | ³ | ³ | ³ | superscript tiga | |
180 | aksen akut | ||||
181 | µ | µ | µ | mikro tanda | |
182 | tanda Pilcrow | ||||
183 | · | · | · | tengah dot | |
184 | . | . | . | cedilla | |
185 | ª | ª | ª | satu superscript | |
186 | Indikator ordinal maskulin | ||||
187 | » | » | » | benar-menunjuk dua sudut tanda kutip | |
188 | 1/4 | 1/4 | 1/4 | vulgar fraksi seperempat | |
189 | 1/2 | 1/2 | 1/2 | vulgar fraksi satu setengah | |
190 | 3/4 | 3/4 | 3/4 | vulgar fraksi tiga perempat | |
191 | tanda tanya terbalik | ||||
192 | À | À | À | Latin huruf A dengan kuburan | |
193 | Á | Á | Á | Latin huruf A dengan akut | |
194 | Â | Â | Â | Latin huruf A dengan sirkumfleksa | |
195 | Ã | Ã | Ã | Latin huruf A dengan tilde | |
196 | Ä | Ä | Ä | Latin huruf A dengan aksen diaeresis | |
197 | Å | Å | Å | Latin huruf A dengan cincin di atas | |
198 | Æ | Æ | Æ | huruf latin AE | |
199 | C | C | C | Latin huruf C dengan cedilla | |
200 | E | E | E | Latin huruf E dengan kuburan | |
201 | E | E | E | Latin huruf E dengan akut | |
202 | E | E | E | Latin huruf E dengan sirkumfleksa | |
203 | E | E | E | Latin huruf E dengan aksen diaeresis | |
204 | I | I | I | huruf latin I dengan kuburan | |
205 | I | I | I | huruf latin I dengan akut | |
206 | I | I | I | huruf latin I dengan sirkumfleksa | |
207 | I | I | I | huruf latin I dengan aksen diaeresis | |
208 | Ð | Ð | Ð | huruf latin Eth | |
209 | Ñ | Ñ | Ñ | Latin huruf N dengan tilde | |
210 | O | O | O | Latin huruf O dengan kuburan | |
211 | O | O | O | Latin huruf O dengan akut | |
212 | O | O | O | Latin huruf O dengan sirkumfleksa | |
213 | O | O | O | Latin huruf O dengan tilde | |
214 | O | O | O | Latin huruf O dengan aksen diaeresis | |
215 | × | × | × | tanda perkalian | |
216 | Ø | Ø | Ø | Latin huruf O stroke | |
217 | U | U | U | huruf latin U dengan kuburan | |
218 | U | U | U | huruf latin U dengan akut | |
219 | U | U | U | huruf latin U dengan sirkumfleksa | |
220 | U | U | U | huruf latin U dengan aksen diaeresis | |
221 | Y | Y | Y | huruf latin Y dengan akut | |
222 | Þ | Þ | Þ | Latin huruf kapital Thorn | |
223 | ß | ß | ß | Surat kecil latin s tajam | |
224 | a | a | a | Latin kecil surat dengan kuburan | |
225 | a | a | a | Latin kecil surat dengan akut | |
226 | a | a | a | Latin kecil surat dengan sirkumfleksa | |
227 | a | a | a | Latin kecil surat dengan tilde | |
228 | a | a | a | Latin kecil surat dengan aksen diaeresis | |
229 | a | a | a | Latin kecil surat dengan cincin di atas | |
230 | a | a | a | Latin kecil surat ae | |
231 | c | c | c | Surat kecil latin c dengan cedilla | |
232 | e | e | e | Latin kecil huruf e dengan kuburan | |
233 | e | e | e | Latin kecil huruf e dengan akut | |
234 | e | e | e | Latin kecil huruf e dengan sirkumfleksa | |
235 | e | e | e | Latin kecil huruf e dengan aksen diaeresis | |
236 | i | i | i | Surat kecil latin i dengan kuburan | |
237 | i | i | i | Surat kecil latin i dengan akut | |
238 | i | i | i | Surat kecil latin i dengan sirkumfleksa | |
239 | i | i | i | Surat kecil latin i dengan aksen diaeresis | |
240 | Latin kecil surat eth | ||||
241 | n | n | n | Latin kecil surat n dengan tilde | |
242 | o | o | o | Surat kecil latin o dengan kuburan | |
243 | o | o | o | Surat kecil latin o dengan akut | |
244 | o | o | o | Surat kecil latin o dengan sirkumfleksa | |
245 | o | o | o | Surat kecil latin o dengan tilde | |
246 | o | o | o | Surat kecil latin o dengan aksen diaeresis | |
247 | ÷ | ÷ | ÷ | tanda bagi | |
248 | Surat kecil latin o stroke | ||||
249 | u | u | u | Surat kecil latin u dengan kuburan | |
250 | u | u | u | Surat kecil latin u dengan akut | |
251 | u | u | u | Surat kecil latin dengan sirkumfleksa | |
252 | u | u | u | Surat kecil latin u dengan aksen diaeresis | |
253 | y | y | y | Latin kecil surat y dengan akut | |
254 | þ | þ | þ | Latin kecil surat duri | |
255 | y | y | y | Latin kecil surat y dengan aksen diaeresis |
ASCII Character Set
ASCII menggunakan nilai 0-31 (and 127) untuk karakter kontrol.
ASCII menggunakan nilai 32-126 untuk huruf, angka, dan simbol.
ASCII tidak menggunakan nilai-nilai 128-255.
ANSI Character Set (Windows-1252)
ANSI identik dengan ASCII untuk nilai 0-127.
ANSI memiliki sekumpulan karakter untuk nilai 128-159.
ANSI identik dengan UTF-8 untuk nilai 160-255.
ISO-8859-1 Set Karakter
8859-1 identik dengan ASCII untuk nilai 0-127.
8859-1 tidak menggunakan nilai-nilai 128-159.
8859-1 identik dengan UTF-8 untuk nilai 160-255.
UTF-8 Character Set
UTF-8 identik dengan ASCII untuk nilai 0-127.
UTF-8 tidak menggunakan nilai-nilai 128-159.
UTF-8 identik dengan baik ANSI dan 8859-1 untuk nilai 160-255.
UTF-8 terus dari nilai 256 dengan lebih dari 10 000 karakter yang berbeda.
Untuk melihat lebih dekat, belajar kami Lengkap HTML Character Set Referensi .