正しくHTMLページを表示するには、Webブラウザが文字セットを知っている必要があります(character encoding)使用します。
文字エンコーディングとは何ですか?
ASCIIは、最初の文字符号化規格 (とも呼ばれる文字セット)でした。 これは、インターネット上で使用できる127個の異なる文字の英数字を定義します。
HTML(ハイパーテキストマークアップ言語)は、1991年から使用されてきたが、HTML 4.0(1997年12月)は、国際的な文字が合理的に完全な治療を与えられた最初の標準化されたバージョンでした。 情報の完全性、およびユニバーサルブラウザ表示:HTMLドキュメントは、7ビットASCIIの範囲外の特殊文字が含まれている場合2つのゴールは検討する価値があります。
ASCIIサポートの数字(0-9)英字(AZ)などいくつかの特殊文字! $ + - ( ) @ < > ! $ + - ( ) @ < >
ANSI (Windows-1252)元のWindows文字セットでした。 これは、256個の異なる文字コードをサポートしていました。
ISO-8859-1は、それはまた、256の異なる文字コードをサポートするHTML 4のデフォルトの文字セットでした。
ANSIやISOが限られていたので、デフォルトの文字エンコーディングは、HTML5でUTF-8に変更しました。
UTF-8 (Unicode)ほぼすべての世界で文字や記号のカバーしています。
すべてのHTML 4つのプロセッサはまた、UTF-8をサポートしています。
HTMLのcharset属性
正しくHTMLページを表示するには、Webブラウザがページで使用される文字セットを知っている必要があります。
これはで指定された<meta>タグ:
HTML4の場合:
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
HTML5の場合:
<meta charset="UTF-8">
ANSIは、ANSIが32余分な文字を持っていることを除き、ISO-8859-1と同一ですので、ブラウザは、それANSIデフォルト、WebページにISO-8859-1を検出した場合。
文字セットの違い
次の表は、上記の文字セット間の違いを表示します。
Numb | ASCII | ANSI | 8859 | UTF-8 | 説明 |
---|---|---|---|---|---|
32 | スペース | ||||
33 | ! | ! | ! | ! | エクスクラメーション・マーク |
34 | " | " | " | " | クォーテーションマーク |
35 | # | # | # | # | 番号記号 |
36 | $ | $ | $ | $ | ドル記号 |
37 | % | % | % | % | パーセント記号 |
38 | & | & | & | & | アンパサンド |
39 | ' | ' | ' | ' | アポストロフィ |
40 | ( | ( | ( | ( | 左括弧 |
41 | ) | ) | ) | ) | 右括弧 |
42 | * | * | * | * | アスタリスク |
43 | + | + | + | + | 正符号 |
44 | , | , | , | , | コンマ |
45 | - | - | - | - | ハイフンマイナス |
46 | . | . | . | . | 終止符 |
47 | / | / | / | / | ソリダス |
48 | 0 | 0 | 0 | 0 | 数字のゼロ |
49 | 1 | 1 | 1 | 1 | 桁1 |
50 | 2 | 2 | 2 | 2 | 数字2 |
51 | 3 | 3 | 3 | 3 | 数字3 |
52 | 4 | 4 | 4 | 4 | 数字4 |
53 | 5 | 5 | 5 | 5 | 数字5 |
54 | 6 | 6 | 6 | 6 | 数字6 |
55 | 7 | 7 | 7 | 7 | 桁7 |
56 | 8 | 8 | 8 | 8 | 数字8 |
57 | 9 | 9 | 9 | 9 | 数字9 |
58 | : | : | : | : | 結腸 |
59 | ; | ; | ; | ; | セミコロン |
60 | < | < | < | < | 小なり記号 |
61 | = | = | = | = | 等号 |
62 | > | > | > | > | 大なり記号 |
63 | ? | ? | ? | ? | クエッションマーク |
64 | @ | @ | @ | @ | 商用で |
65 | A | A | A | A | ラテン大文字A |
66 | B | B | B | B | ラテン大文字B |
67 | C | C | C | C | ラテン大文字C |
68 | D | D | D | D | ラテン大文字D |
69 | E | E | E | E | ラテン大文字E |
70 | F | F | F | F | ラテン大文字F |
71 | G | G | G | G | ラテン大文字G |
72 | H | H | H | H | ラテン大文字H |
73 | I | I | I | I | ラテン大文字I |
74 | J | J | J | J | ラテン大文字J |
75 | K | K | K | K | ラテン大文字K |
76 | L | L | L | L | ラテン大文字L |
77 | M | M | M | M | ラテン大文字M |
78 | N | N | N | N | ラテン大文字N |
79 | O | O | O | O | ラテン大文字O |
80 | P | P | P | P | ラテン大文字P |
81 | Q | Q | Q | Q | ラテン大文字Q |
82 | R | R | R | R | ラテン大文字R |
83 | S | S | S | S | ラテン大文字S |
84 | T | T | T | T | ラテン大文字T |
85 | U | U | U | U | ラテン大文字U |
86 | V | V | V | V | ラテン大文字V |
87 | W | W | W | W | ラテン大文字W |
88 | X | X | X | X | ラテン大文字X |
89 | Y | Y | Y | Y | ラテン大文字Y |
90 | Z | Z | Z | Z | ラテン大文字Z |
91 | [ | [ | [ | [ | 左角括弧 |
92 | \ | \ | \ | \ | 逆ソリダス |
93 | ] | ] | ] | ] | 右角カッコ |
94 | ^ | ^ | ^ | ^ | 曲折アクセント |
95 | _ | _ | _ | _ | 低いライン |
96 | ` | ` | ` | ` | 低アクセント |
97 | a | a | a | a | ラテン小文字a |
98 | b | b | b | b | ラテン小さな文字b |
99 | c | c | c | c | 小さなラテン文字c |
100 | d | d | d | d | ラテン小さな文字d |
101 | e | e | e | e | ラテン小文字e |
102 | f | f | f | f | ラテン小さな文字F |
103 | g | g | g | g | ラテン小さな文字g |
104 | h | h | h | h | ラテン小さな文字h |
105 | i | i | i | i | ラテン小文字のI |
106 | j | j | j | j | ラテン小文字J |
107 | k | k | k | k | ラテン小文字のk |
108 | l | l | l | l | ラテン小さな文字l |
109 | m | m | m | m | ラテン小さな文字m |
110 | n | n | n | n | ラテン小文字のn |
111 | o | o | o | o | 小さなラテンアルファベットのO |
112 | p | p | p | p | ラテン小さな文字p |
113 | q | q | q | q | ラテン小文字のq |
114 | r | r | r | r | ラテン小さな文字r |
115 | s | s | s | s | ラテン小文字の |
116 | t | t | t | t | ラテン小さな文字t |
117 | u | u | u | u | ラテン小文字u |
118 | v | v | v | v | ラテン小文字V |
119 | w | w | w | w | ワットラテン小文字 |
120 | x | x | x | x | ラテン小さな文字x |
121 | y | y | y | y | ラテン小さな文字y |
122 | z | z | z | z | 小さなラテン文字Z |
123 | { | { | { | { | 左中かっこ |
124 | | | | | | | | | 縦線 |
125 | } | } | } | } | 右中かっこ |
126 | ~ | ~ | ~ | ~ | チルダ |
127 | DEL | ||||
128 | € | ユーロ記号 | |||
129 | 使用されていない | ||||
130 | ‚ | 単一の低9引用符 | |||
131 | ƒ | フックとFラテン小文字 | |||
132 | „ | ダブル低9引用符 | |||
133 | … | 水平方向の反復記号 | |||
134 | † | 短剣 | |||
135 | ‡ | ダブルダガー | |||
136 | ˆ | 修飾子手紙曲折アクセント | |||
137 | ‰ | ミル記号あたり | |||
138 | Š | キャロン付きラテン大文字S | |||
139 | ‹ | シングル左向き角引用符 | |||
140 | Œ | ラテン資本リガチャーOE | |||
141 | 使用されていない | ||||
142 | Z | キャロン付きラテン大文字Z | |||
143 | 使用されていない | ||||
144 | 使用されていない | ||||
145 | ‘ | 左一重引用符 | |||
146 | ’ | 右の単一引用符 | |||
147 | “ | 左の二重引用符 | |||
148 | ” | 右の二重引用符 | |||
149 | • | 弾丸 | |||
150 | – | 半角ダッシュ | |||
151 | — | 全角ダッシュ | |||
152 | ˜ | 小さなチルダ | |||
153 | ™ | トレードマークの看板 | |||
154 | š | キャロン付きラテン小文字の | |||
155 | › | シングル右向きのアングル引用符 | |||
156 | œ | 小さなラテンリガチャーOE | |||
157 | 使用されていない | ||||
158 | z | キャロン付きラテン文字Z | |||
159 | Ÿ | 分音記号付きラテン大文字Y | |||
160 | ノーブレークスペース | ||||
161 | 逆感嘆符 | ||||
162 | ¢ | ¢ | ¢ | セント記号 | |
163 | £ | £ | £ | ポンド記号 | |
164 | 通貨記号 | ||||
165 | ¥ | ¥ | ¥ | 円記号 | |
166 | ¦ | ¦ | ¦ | 壊れたバー | |
167 | § | § | § | セクション記号 | |
168 | ¨ | ¨ | ¨ | ダイエレシス | |
169 | © | © | © | 著作権記号 | |
170 | ª | ª | ª | 女性序数標識 | |
171 | « | « | « | 左向きの二重角引用符 | |
172 | 署名していません | ||||
173 | | | | ソフトハイフン | |
174 | ® | ® | ® | 登録記号 | |
175 | ¯ | ¯ | ¯ | マカロン | |
176 | ° | ° | ° | 度の記号 | |
177 | ± | ± | ± | プラスマイナス記号 | |
178 | ² | ² | ² | 上付き文字2 | |
179 | ³ | ³ | ³ | 上付き3 | |
180 | 急性アクセント | ||||
181 | µ | µ | µ | マイクロ記号 | |
182 | 段落記号記号 | ||||
183 | · | · | · | 中ドット | |
184 | . | . | . | カンマ | |
185 | ª | ª | ª | 上付き1 | |
186 | 男性の序数標識 | ||||
187 | » | » | » | 右向きの二重角引用符 | |
188 | 1/4 | 1/4 | 1/4 | 下品な分数四分の一 | |
189 | 1/2 | 1/2 | 1/2 | 下品な分数の半分 | |
190 | 3/4 | 3/4 | 3/4 | 下品な分数四分の三 | |
191 | 逆疑問符 | ||||
192 | À | À | À | 墓付きラテン大文字A | |
193 | Á | Á | Á | 急性付きラテン大文字A | |
194 | Â | Â | Â | 曲折アクセント付きラテン大文字A | |
195 | Ã | Ã | Ã | チルダ付きラテン大文字A | |
196 | Ä | Ä | Ä | 分音記号付きラテン大文字A | |
197 | Å | Å | Å | 上記リング付きラテン大文字A | |
198 | Æ | Æ | Æ | ラテン大文字AE | |
199 | C | C | C | セディーユ付きラテン大文字C | |
200 | E | E | E | 墓付きラテン大文字E | |
201 | E | E | E | 急性付きラテン大文字E | |
202 | E | E | E | 曲折アクセント付きラテン大文字E | |
203 | E | E | E | 分音記号付きラテン大文字E | |
204 | I | I | I | 墓付きラテン大文字I | |
205 | I | I | I | 急性付きラテン大文字I | |
206 | I | I | I | 曲折アクセント付きラテン大文字I | |
207 | I | I | I | 分音記号付きラテン大文字I | |
208 | Ð | Ð | Ð | ラテン大文字のEth | |
209 | Ñ | Ñ | Ñ | チルダ付きラテン大文字N | |
210 | O | O | O | 墓付きラテン大文字O | |
211 | O | O | O | 急性付きラテン大文字O | |
212 | O | O | O | 曲折アクセント付きラテン大文字O | |
213 | O | O | O | チルダ付きラテン大文字O | |
214 | O | O | O | 分音記号付きラテン大文字O | |
215 | × | × | × | 乗算記号 | |
216 | Ø | Ø | Ø | ストローク付きラテン大文字O | |
217 | U | U | U | 墓付きラテン大文字U | |
218 | U | U | U | 急性付きラテン大文字U | |
219 | U | U | U | 曲折アクセント付きラテン大文字U | |
220 | U | U | U | 分音記号付きラテン大文字U | |
221 | Y | Y | Y | 急性付きラテン大文字Y | |
222 | Þ | Þ | Þ | ラテン大文字ソーン | |
223 | ß | ß | ß | ラテン小文字シャープS | |
224 | a | a | a | 墓とラテン小文字a | |
225 | a | a | a | 急性付きラテン小文字a | |
226 | a | a | a | 曲折アクセント付きラテン小文字a | |
227 | a | a | a | チルダ付きラテン小文字a | |
228 | a | a | a | 分音記号付きラテン小文字a | |
229 | a | a | a | 上記リング付きラテン小文字a | |
230 | a | a | a | ラテン小文字AE | |
231 | c | c | c | セディーユ付きCラテン小文字 | |
232 | e | e | e | 墓とラテン小文字e | |
233 | e | e | e | 急性付きラテン小文字e | |
234 | e | e | e | 曲折アクセント付きラテン小文字e | |
235 | e | e | e | 分音記号付きラテン小文字e | |
236 | i | i | i | 墓付きラテン小文字のI | |
237 | i | i | i | 急性の小さなラテン文字I | |
238 | i | i | i | 曲折アクセント付きラテン小文字のI | |
239 | i | i | i | 分音記号付きラテン小文字のI | |
240 | ラテン小文字ETH | ||||
241 | n | n | n | チルダ付きラテン小文字のn | |
242 | o | o | o | 墓とラテン小文字o | |
243 | o | o | o | 急性付きラテン小文字o | |
244 | o | o | o | 曲折アクセント付きラテン小文字o | |
245 | o | o | o | チルダ付きラテン小文字o | |
246 | o | o | o | 分音記号付きラテン小文字o | |
247 | ÷ | ÷ | ÷ | 除算記号 | |
248 | 脳卒中とラテン小文字o | ||||
249 | u | u | u | 墓とラテン小文字u | |
250 | u | u | u | 急性付きラテン小文字u | |
251 | u | u | u | 曲折アクセント付きラテン小文字 | |
252 | u | u | u | 分音記号付きラテン小文字u | |
253 | y | y | y | 急性付きラテン文字y | |
254 | þ | þ | þ | ラテン小文字のとげ | |
255 | y | y | y | 分音記号付きラテン文字y |
ASCII文字セット
ASCIIは、0から31までの値を使用して(and 127)制御文字のため。
ASCIIは、文字、数字、および記号のために32から126までの値を使用します。
ASCIIは、128から255までの値を使用していません。
ANSI文字セット(Windows-1252)
ANSIは、0から127までの値のASCIIと同一です。
ANSIは、128から159までの値の文字の独自のセットを持っています。
ANSIは、160から255までの値のUTF-8と同一です。
ISO-8859-1文字セット
8859-1は、0から127までの値のASCIIと同一です。
8859-1は、128から159までの値を使用していません。
8859-1は、160から255までの値のUTF-8と同一です。
UTF-8文字セット
UTF-8は、0から127までの値のASCIIと同一です。
UTF-8は、128から159までの値を使用していません。
UTF-8は、160から255までの値のANSI及び8859の両方に同じです。
UTF-8は、10個の以上000の異なる文字を有する値256から継続します。
よく見るために、私たちの研究完全なHTML文字セットの参照を 。