올바르게 HTML 페이지를 표시하려면, 웹 브라우저는 문자 집합을 알고 있어야합니다 (character encoding) 사용합니다.
문자 인코딩은 무엇인가?
ASCII (또한 문자 집합이라고도 함)의 첫 번째 문자 인코딩 표준이었다. 그것은 인터넷에서 사용할 수있는 127 개 가지 영숫자 문자를 정의합니다.
HTML (하이퍼 텍스트 마크 업 언어)은 1991 년부터 사용되어 왔지만, HTML 4.0 (1997 년 12 월) 국제 문자가 합리적으로 완전한 치료를 받았다 최초의 표준화 된 버전이었다. HTML 문서는 일곱 비트 ASCII의 범위 밖에있는 특수 문자를 포함하면 두 가지 목표는 고려 가치가있다 : 정보의 무결성 및 보편적 인 브라우저 표시됩니다.
ASCII 지원 숫자 (0-9) , 영문자 (AZ) 와 같은 일부 특수 문자 ! $ + - ( ) @ < > ! $ + - ( ) @ < > .
ANSI (Windows-1252) 원래 Windows 문자 집합이었다. 그것은 256 개 개의 서로 다른 문자 코드를 지원했다.
ISO-8859-1 또한 256 개 개의 서로 다른 문자 코드를 지원하는 HTML 4에 설정된 기본 문자였다.
ANSI와 ISO가 제한 되었기 때문에, 디폴트 문자 인코딩 HTML5에서 UTF-8로 변경 하였다.
UTF-8 (Unicode) 거의 모든 세계에서 문자 및 기호의 설명합니다.
모든 HTML 4 개 프로세서는 UTF-8을 지원합니다.
는 HTML 문자 집합 속성
올바르게 HTML 페이지를 표시하려면 웹 브라우저 페이지에서 사용되는 문자 집합을 알고 있어야합니다.
이것은에 지정된 <meta> 태그 :
HTML4의 경우 :
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
HTML5의 경우 :
<meta charset="UTF-8">
브라우저가 웹 페이지에 ISO-8859-1을 감지하면 그 ANSI 32 개 여분의 문자가 제외하고, 그것은 ANSI 기본값, ANSI는 ISO-8859-1 동일하기 때문이다.
문자 집합의 차이점
다음 표는 상술 된 문자 세트들 사이의 차이를 표시
Numb | ASCII | ANSI | 8859 | UTF-8 | 기술 |
---|---|---|---|---|---|
32 | 공간 | ||||
33 | ! | ! | ! | ! | 느낌표 |
34 | " | " | " | " | 인용 부호 |
35 | # | # | # | # | 숫자 기호 |
36 | $ | $ | $ | $ | 달러 기호 |
37 | % | % | % | % | 퍼센트 기호 |
38 | & | & | & | & | 앰퍼샌드 |
39 | ' | ' | ' | ' | 아포스트로피 |
40 | ( | ( | ( | ( | 왼쪽 괄호 |
41 | ) | ) | ) | ) | 오른쪽 괄호 |
42 | * | * | * | * | 별표 |
43 | + | + | + | + | 더하기 기호 |
44 | , | , | , | , | 콤마 |
45 | - | - | - | - | 하이픈 - 마이너스 |
46 | . | . | . | . | 마침표 |
47 | / | / | / | / | 상선 |
48 | 0 | 0 | 0 | 0 | 자리 제로 |
49 | 1 | 1 | 1 | 1 | 자리 하나 |
50 | 2 | 2 | 2 | 2 | 자리 두 |
51 | 3 | 3 | 3 | 3 | 자리 세 |
52 | 4 | 4 | 4 | 4 | 자리 네 |
53 | 5 | 5 | 5 | 5 | 자리 오 |
54 | 6 | 6 | 6 | 6 | 자리 육 |
55 | 7 | 7 | 7 | 7 | 자리 칠 |
56 | 8 | 8 | 8 | 8 | 자리 팔 |
57 | 9 | 9 | 9 | 9 | 자리 구 |
58 | : | : | : | : | 콜론 |
59 | ; | ; | ; | ; | 세미콜론 |
60 | < | < | < | < | 보다 작음 기호 |
61 | = | = | = | = | 등호 |
62 | > | > | > | > | 기호보다 큰 |
63 | ? | ? | ? | ? | 물음표 |
64 | @ | @ | @ | @ | 에서 상업 |
65 | A | A | A | A | 라틴어 대문자 A |
66 | B | B | B | B | 라틴어 대문자 B |
67 | C | C | C | C | 라틴어 대문자 C |
68 | D | D | D | D | 라틴어 대문자 D |
69 | E | E | E | E | 라틴어 대문자 E |
70 | F | F | F | F | 라틴어 대문자 F |
71 | G | G | G | G | 라틴어 대문자 G |
72 | H | H | H | H | 라틴어 대문자 H |
73 | I | I | I | I | 라틴어 대문자 I |
74 | J | J | J | J | 라틴어 대문자 J |
75 | K | K | K | K | 라틴어 대문자 K |
76 | L | L | L | L | 라틴어 대문자 L |
77 | M | M | M | M | 라틴어 대문자 M |
78 | N | N | N | N | 라틴어 대문자 N |
79 | O | O | O | O | 라틴어 대문자 O |
80 | P | P | P | P | 라틴어 대문자 P |
81 | Q | Q | Q | Q | 라틴어 대문자 Q |
82 | R | R | R | R | 라틴어 대문자 R |
83 | S | S | S | S | 라틴어 대문자 S |
84 | T | T | T | T | 라틴어 대문자 T |
85 | U | U | U | U | 라틴어 대문자 U |
86 | V | V | V | V | 라틴어 대문자 V |
87 | W | W | W | W | 라틴어 대문자 W |
88 | X | X | X | X | 라틴어 대문자 X |
89 | Y | Y | Y | Y | 라틴어 대문자 Y |
90 | Z | Z | Z | Z | 라틴어 대문자 Z |
91 | [ | [ | [ | [ | 왼쪽 대괄호 |
92 | \ | \ | \ | \ | 역 상선 |
93 | ] | ] | ] | ] | 우측 대괄호 |
94 | ^ | ^ | ^ | ^ | 곡절 악센트 |
95 | _ | _ | _ | _ | 낮은 라인 |
96 | ` | ` | ` | ` | 억음 악센트 |
97 | a | a | a | a | 라틴어 편지에 |
98 | b | b | b | b | 라틴어 소문자 (B) |
99 | c | c | c | c | 라틴어 문자 c |
100 | d | d | d | d | 라틴어 문자 D |
101 | e | e | e | e | 라틴어 작은 문자 e |
102 | f | f | f | f | 라틴어 소문자 F |
103 | g | g | g | g | 라틴어 소문자 g |
104 | h | h | h | h | 라틴어 소문자 시간 |
105 | i | i | i | i | 라틴어 소문자 I |
106 | j | j | j | j | 라틴어 소문자 J |
107 | k | k | k | k | 라틴어 소문자 K |
108 | l | l | l | l | 라틴어 문자 l |
109 | m | m | m | m | 라틴어 소문자 m |
110 | n | n | n | n | 라틴어 문자 n |
111 | o | o | o | o | 라틴어 소문자 오 |
112 | p | p | p | p | 라틴어 소문자 P |
113 | q | q | q | q | 라틴어 소문자 q를 |
114 | r | r | r | r | 라틴어 소문자 R |
115 | s | s | s | s | 라틴어 소문자 S |
116 | t | t | t | t | 라틴어 소문자 t |
117 | u | u | u | u | 라틴어 소문자 U를 |
118 | v | v | v | v | 라틴어 문자 v |
119 | w | w | w | w | w 라틴어 소문자 |
120 | x | x | x | x | 라틴어 문자 x |
121 | y | y | y | y | 라틴어 소문자 y를 |
122 | z | z | z | z | 라틴어 문자 z |
123 | { | { | { | { | 왼쪽 중괄호 |
124 | | | | | | | | | 수직선 |
125 | } | } | } | } | 바로 중괄호 |
126 | ~ | ~ | ~ | ~ | 틸데 |
127 | DEL | ||||
128 | € | 유로 기호 | |||
129 | USED하지 | ||||
130 | ‚ | 하나의 낮은 9 따옴표 | |||
131 | ƒ | 후크 F 라틴어 소문자 | |||
132 | „ | 이중 낮은 9 따옴표 | |||
133 | … | 수평 줄임표 | |||
134 | † | 단검 | |||
135 | ‡ | 이중 단검 | |||
136 | ˆ | 수정 문자 곡절 악센트 | |||
137 | ‰ | 밀레 기호 당 | |||
138 | Š | 카논 라틴어 대문자 S | |||
139 | ‹ | 단일 왼쪽을 가리키는 각도 따옴표 | |||
140 | Œ | 라틴어 자본 합자 OE | |||
141 | USED하지 | ||||
142 | Z | 카논 라틴어 대문자 Z | |||
143 | USED하지 | ||||
144 | USED하지 | ||||
145 | ‘ | 왼쪽 작은 따옴표 | |||
146 | ’ | 오른쪽 작은 따옴표 | |||
147 | “ | 왼쪽 큰 따옴표 | |||
148 | ” | 바로 따옴표 | |||
149 | • | 총알 | |||
150 | – | 대시 엉 | |||
151 | — | 전각 대시 | |||
152 | ˜ | 작은 물결 | |||
153 | ™ | 상표 기호 | |||
154 | š | 캐런 라틴 소문자의 | |||
155 | › | 하나의 오른쪽을 가리키는 각도 따옴표 | |||
156 | œ | 라틴어 작은 합자 OE | |||
157 | USED하지 | ||||
158 | z | 캐런 라틴 작은 문자 z | |||
159 | Ÿ | 분음 기호가 붙은 라틴어 대문자 Y | |||
160 | 노 휴식 공간 | ||||
161 | 반전 느낌표 | ||||
162 | ¢ | ¢ | ¢ | 퍼센트 기호 | |
163 | £ | £ | £ | 파운드 기호 | |
164 | 통화 기호 | ||||
165 | ¥ | ¥ | ¥ | 엔 기호 | |
166 | ¦ | ¦ | ¦ | 깨진 바 | |
167 | § | § | § | 섹션 기호 | |
168 | ¨ | ¨ | ¨ | 분음 | |
169 | © | © | © | 저작권 기호 | |
170 | ª | ª | ª | 여성 서수 표시 | |
171 | « | « | « | 왼쪽을 가리키는 이중 꺽쇠 따옴표 | |
172 | 서명하지 | ||||
173 | | | | 소프트 하이픈 | |
174 | ® | ® | ® | 등록 기호 | |
175 | ¯ | ¯ | ¯ | 장음 | |
176 | ° | ° | ° | 도 기호 | |
177 | ± | ± | ± | 플러스 마이너스 | |
178 | ² | ² | ² | 첨자이 | |
179 | ³ | ³ | ³ | 첨자 세 | |
180 | 악센트 | ||||
181 | µ | µ | µ | 마이크로 기호 | |
182 | 단락 기호 기호 | ||||
183 | · | · | · | 중간 점 | |
184 | . | . | . | 세 디유 | |
185 | ª | ª | ª | 첨자 하나 | |
186 | 남성 서수 표시 | ||||
187 | » | » | » | 오른쪽을 가리키는 이중 꺽쇠 따옴표 | |
188 | 1/4 | 1/4 | 1/4 | 저속 부분 사분 | |
189 | 1/2 | 1/2 | 1/2 | 저속 분획 절반 | |
190 | 3/4 | 3/4 | 3/4 | 저속 분획 사분의 삼 | |
191 | 역 물음표 | ||||
192 | À | À | À | 무덤 붙은 라틴어 대문자 A | |
193 | Á | Á | Á | 급성가 붙은 라틴어 대문자 A | |
194 | Â | Â | Â | 곡절가 붙은 라틴어 대문자 A | |
195 | Ã | Ã | Ã | 물결표가 붙은 라틴어 대문자 A | |
196 | Ä | Ä | Ä | 분음 기호가 붙은 라틴어 대문자 A | |
197 | Å | Å | Å | 위의 고리가 붙은 라틴어 대문자 A | |
198 | Æ | Æ | Æ | 라틴어 대문자 AE | |
199 | C | C | C | 디유 라틴 대문자 C | |
200 | E | E | E | 무덤 라틴 대문자 E | |
201 | E | E | E | 급성와 라틴어 대문자 E | |
202 | E | E | E | 곡절 악센트가 붙은 라틴어 대문자 E | |
203 | E | E | E | 분음 기호가 붙은 라틴어 대문자 E | |
204 | I | I | I | 무덤 붙은 라틴어 대문자 I | |
205 | I | I | I | 급성 라틴 대문자 I를 | |
206 | I | I | I | 곡절가 붙은 라틴어 대문자 I | |
207 | I | I | I | 분음 기호가 붙은 라틴어 대문자 I | |
208 | Ð | Ð | Ð | 라틴어 대문자 ETH | |
209 | Ñ | Ñ | Ñ | 물결표와 라틴어 대문자 N | |
210 | O | O | O | 무덤 라틴 대문자 O | |
211 | O | O | O | 급성 라틴 대문자 O | |
212 | O | O | O | 곡절 악센트가 붙은 라틴어 대문자 O | |
213 | O | O | O | 물결표와 라틴어 대문자 O | |
214 | O | O | O | 분음 기호가 붙은 라틴어 대문자 O | |
215 | × | × | × | 곱셈 기호 | |
216 | Ø | Ø | Ø | 스트로크 라틴어 대문자 O | |
217 | U | U | U | 무덤 라틴 대문자 U | |
218 | U | U | U | 급성 라틴 대문자 U를 | |
219 | U | U | U | 곡절 라틴 대문자 U | |
220 | U | U | U | 분음 기호가 붙은 라틴어 대문자 U | |
221 | Y | Y | Y | 급성 라틴 대문자 Y | |
222 | Þ | Þ | Þ | 라틴어 대문자 가시 | |
223 | ß | ß | ß | 라틴어 소문자 날카로운들 | |
224 | a | a | a | 무덤 라틴 작은 편지에 | |
225 | a | a | a | 급성 라틴 작은 편지에 | |
226 | a | a | a | 곡절 라틴 작은 편지에 | |
227 | a | a | a | 물결표가 붙은 라틴어 편지에 | |
228 | a | a | a | 분음 기호가 붙은 라틴어 편지에 | |
229 | a | a | a | 위의 고리가 붙은 라틴어 편지에 | |
230 | a | a | a | 라틴어 소문자 AE | |
231 | c | c | c | 디유와 C 라틴어 소문자 | |
232 | e | e | e | 무덤 라틴 작은 문자 e | |
233 | e | e | e | 급성 라틴 작은 문자 e | |
234 | e | e | e | 곡절 라틴 작은 문자 e | |
235 | e | e | e | 분음 기호가 붙은 라틴어 문자 e | |
236 | i | i | i | 무덤에 라틴어 나 편지를 | |
237 | i | i | i | 급성 라틴 작은 편지 나에게 | |
238 | i | i | i | 곡절와 라틴어 나 편지를 | |
239 | i | i | i | 분음 기호가 붙은 라틴어 나 편지를 | |
240 | 라틴어 소문자 ETH | ||||
241 | n | n | n | 물결표가 붙은 라틴어 문자 n | |
242 | o | o | o | 무덤에 라틴어 소문자 o | |
243 | o | o | o | 급성와 라틴어 소문자 o | |
244 | o | o | o | 곡절와 라틴어 소문자 o | |
245 | o | o | o | 물결표와 라틴어 소문자 o | |
246 | o | o | o | 분음와 라틴어 소문자 o | |
247 | ÷ | ÷ | ÷ | 구분 기호 | |
248 | 스트로크 라틴어 소문자 o | ||||
249 | u | u | u | 무덤 라틴 작은 문자 U를 | |
250 | u | u | u | 급성 라틴 작은 문자 U를 | |
251 | u | u | u | 곡절 라틴 소문자 | |
252 | u | u | u | 분음 기호가 붙은 라틴어 문자 U를 | |
253 | y | y | y | 급성 라틴 소문자 y를 | |
254 | þ | þ | þ | 라틴어 소문자 가시 | |
255 | y | y | y | 분음 기호가 붙은 라틴어 소문자 y를 |
ASCII 문자 집합
ASCII는 0 내지 31의 값을 사용한다 (and 127) 의 제어가 문자.
ASCII 문자, 숫자 및 기호 (32)로부터 126의 값을 사용한다.
ASCII는 128에서 255의 값을 사용하지 않습니다.
ANSI 문자 집합 (Windows-1252)
ANSI는 0 ~ 127의 값 아스키와 동일하다.
ANSI는 128에서 159의 값을 문자의 고유 세트를 갖는다.
ANSI는 UTF-8 160 ~ 255의 값과 동일하다.
ISO-8859-1 문자 집합
8859는 0부터 127까지의 값 아스키와 동일하다.
8859 128에서 159까지의 값을 사용하지 않는다.
8859은 UTF-8 160 ~ 255의 값과 동일하다.
UTF-8 문자 집합
UTF-8은 0 ~ 127의 값 아스키와 동일하다.
UTF-8은 128에서 159까지의 값을 사용하지 않는다.
UTF-8은 ANSI 160 ~ 255의 값에 대한 8859 모두 동일하다.
UTF-8은 10 개 이상의 서로 다른 000 개의 문자 값 (256)에서 계속된다.
자세히 살펴 들어, 우리의 연구 전체 HTML 문자 집합 참조 .