Para visualizar una página HTML correctamente, un navegador web debe conocer el conjunto de caracteres (character encoding) para su uso.
¿Qué es la codificación de caracteres?
ASCII fue el primer estándar de codificación de caracteres (también llamado juego de caracteres). Define 127 caracteres alfanuméricos diferentes que podrían ser utilizados en Internet.
HTML (Hypertext Markup Language) ha estado en uso desde 1991, pero HTML 4.0 (diciembre de 1997) fue la primera versión estandarizada, donde se les dio tratamiento caracteres internacionales razonablemente completa. Cuando un documento HTML incluye caracteres especiales por fuera del rango de ASCII de siete bits dos metas son dignas de consideración: la integridad de la información, y la pantalla del navegador universal.
Números apoyado ASCII (0-9) , letras del alfabeto inglés (AZ) , y algunos caracteres especiales como ! $ + - ( ) @ < > ! $ + - ( ) @ < > .
ANSI (Windows-1252) fue el conjunto original de caracteres de Windows. Se contaba con 256 códigos de caracteres diferentes.
ISO-8859-1 fue el juego de caracteres predeterminado para HTML 4. También contaba con 256 códigos de caracteres diferentes.
Debido a ANSI e ISO eran limitados, la codificación de caracteres por defecto fue cambiado a UTF-8 en HTML5.
UTF-8 (Unicode) cubre casi todos los caracteres y símbolos en el mundo.
Todos los procesadores de HTML 4 también soporta UTF-8.
El juego de caracteres atributo HTML
Para visualizar una página HTML correctamente, un navegador web debe conocer el conjunto de caracteres utilizado en la página.
Esto se especifica en el <meta> etiqueta:
Para HTML 4:
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
Para HTML5:
<meta charset="UTF-8">
Si un navegador detecta ISO-8859-1 en una página web, que por defecto es ANSI, ANSI, porque es idéntica a la norma ISO-8859-1, excepto que ANSI tiene 32 caracteres adicionales.
Diferencias entre el conjunto de caracteres
La siguiente tabla muestra las diferencias entre los conjuntos de caracteres descritos anteriormente:
Numb | ASCII | ANSI | 8859 | UTF-8 | Descripción |
---|---|---|---|---|---|
32 | espacio | ||||
33 | ! | ! | ! | ! | signo de exclamación |
34 | " | " | " | " | comilla |
35 | # | # | # | # | símbolo de número |
36 | $ | $ | $ | $ | signo de dólar |
37 | % | % | % | % | signo de porcentaje |
38 | & | & | & | & | signo & |
39 | ' | ' | ' | ' | apóstrofe |
40 | ( | ( | ( | ( | paréntesis izquierdo |
41 | ) | ) | ) | ) | paréntesis derecho |
42 | * | * | * | * | asterisco |
43 | + | + | + | + | Signo de más |
44 | , | , | , | , | coma |
45 | - | - | - | - | Guión menos |
46 | . | . | . | . | punto |
47 | / | / | / | / | solidus |
48 | 0 | 0 | 0 | 0 | cero dígitos |
49 | 1 | 1 | 1 | 1 | un dígito |
50 | 2 | 2 | 2 | 2 | dos dígitos |
51 | 3 | 3 | 3 | 3 | tres dígitos |
52 | 4 | 4 | 4 | 4 | cuatro dígitos |
53 | 5 | 5 | 5 | 5 | cinco dígitos |
54 | 6 | 6 | 6 | 6 | seis dígitos |
55 | 7 | 7 | 7 | 7 | siete dígitos |
56 | 8 | 8 | 8 | 8 | ocho dígitos |
57 | 9 | 9 | 9 | 9 | nueve dígitos |
58 | : | : | : | : | colon |
59 | ; | ; | ; | ; | punto y coma |
60 | < | < | < | < | signo menor que |
61 | = | = | = | = | signo de igual |
62 | > | > | > | > | signo mayor que |
63 | ? | ? | ? | ? | signo de interrogación |
64 | @ | @ | @ | @ | comercial a |
65 | A | A | A | A | Una letra mayúscula América |
66 | B | B | B | B | Letra latina mayúscula |
67 | C | C | C | C | Letra latina mayúscula |
68 | D | D | D | D | letra mayúscula D latina |
69 | E | E | E | E | E mayúscula América |
70 | F | F | F | F | América letra F |
71 | G | G | G | G | letra mayúscula G América |
72 | H | H | H | H | Letra latina mayúscula |
73 | I | I | I | I | América I mayúscula |
74 | J | J | J | J | América capital letra J |
75 | K | K | K | K | América letra mayúscula K |
76 | L | L | L | L | Letra latina mayúscula |
77 | M | M | M | M | Letra latina mayúscula |
78 | N | N | N | N | América letra mayúscula N |
79 | O | O | O | O | Letra latina O mayúscula |
80 | P | P | P | P | letra mayúscula P América |
81 | Q | Q | Q | Q | América letra Q |
82 | R | R | R | R | Letra latina mayúscula |
83 | S | S | S | S | América letra mayúscula S |
84 | T | T | T | T | letra mayúscula T América |
85 | U | U | U | U | Letra latina U mayúscula |
86 | V | V | V | V | América letra mayúscula V |
87 | W | W | W | W | América letra mayúscula W |
88 | X | X | X | X | América letra mayúscula X |
89 | Y | Y | Y | Y | Letra latina mayúscula |
90 | Z | Z | Z | Z | América letra mayúscula Z |
91 | [ | [ | [ | [ | corchete izquierdo |
92 | \ | \ | \ | \ | solidus inversa |
93 | ] | ] | ] | ] | corchete derecho |
94 | ^ | ^ | ^ | ^ | acento circunflejo |
95 | _ | _ | _ | _ | línea baja |
96 | ` | ` | ` | ` | acento grave |
97 | a | a | a | a | Letra latina pequeña una |
98 | b | b | b | b | Letra latina pequeña b |
99 | c | c | c | c | Letra latina pequeña c |
100 | d | d | d | d | América pequeña letra d |
101 | e | e | e | e | Letra latina e minúscula |
102 | f | f | f | f | América pequeña letra f |
103 | g | g | g | g | América pequeña letra g |
104 | h | h | h | h | América pequeña letra h |
105 | i | i | i | i | América pequeña letra i |
106 | j | j | j | j | América pequeña letra j |
107 | k | k | k | k | América pequeña letra k |
108 | l | l | l | l | América pequeña letra l |
109 | m | m | m | m | América pequeña letra m |
110 | n | n | n | n | América pequeña letra n |
111 | o | o | o | o | América pequeña letra o |
112 | p | p | p | p | Letra latina pequeña p |
113 | q | q | q | q | Letra latina pequeña q |
114 | r | r | r | r | Letra latina pequeña r |
115 | s | s | s | s | América pequeña letra s |
116 | t | t | t | t | Letra latina t pequeña |
117 | u | u | u | u | Letra latina u |
118 | v | v | v | v | América pequeña letra v |
119 | w | w | w | w | Letra latina w |
120 | x | x | x | x | América pequeña letra x |
121 | y | y | y | y | América pequeña letra y |
122 | z | z | z | z | América pequeña letra z |
123 | { | { | { | { | corchete izquierdo |
124 | | | | | | | | | linea vertical |
125 | } | } | } | } | corchete derecho |
126 | ~ | ~ | ~ | ~ | tilde |
127 | DEL | ||||
128 | € | Muestra euro | |||
129 | NO UTILIZADO | ||||
130 | ‚ | comilla bajo 9 | |||
131 | ƒ | Letra latina f con gancho | |||
132 | „ | doble comilla bajo 9 | |||
133 | … | Puntos suspensivos horizontales | |||
134 | † | daga | |||
135 | ‡ | daga doble | |||
136 | ˆ | carta de modificador de acento circunflejo | |||
137 | ‰ | por cartel Mille | |||
138 | Š | Letra latina mayúscula S con caron | |||
139 | ‹ | comilla ángulo apunta hacia la izquierda | |||
140 | Œ | capital de América ligadura de OE | |||
141 | NO UTILIZADO | ||||
142 | Z | América letra mayúscula Z con caron | |||
143 | NO UTILIZADO | ||||
144 | NO UTILIZADO | ||||
145 | ‘ | comilla simple izquierda | |||
146 | ’ | comilla simple derecho | |||
147 | “ | comillas dobles izquierda | |||
148 | ” | comilla doble hacia la derecha | |||
149 | • | bala | |||
150 | – | guión corto | |||
151 | — | guión largo | |||
152 | ˜ | pequeña tilde | |||
153 | ™ | signo de marca | |||
154 | š | Letra latina s con caron | |||
155 | › | comilla ángulo apunta hacia la derecha sola | |||
156 | œ | América pequeña oe ligadura | |||
157 | NO UTILIZADO | ||||
158 | z | América pequeña letra z con caron | |||
159 | Ÿ | letra mayúscula América Y con diéresis | |||
160 | no-break espacio | ||||
161 | signo de exclamación invertida | ||||
162 | ¢ | ¢ | ¢ | símbolo de centavos | |
163 | £ | £ | £ | signo de Libra | |
164 | Muestra de dinero | ||||
165 | ¥ | ¥ | ¥ | signo de yenes | |
166 | ¦ | ¦ | ¦ | barra rota | |
167 | § | § | § | sección de signo | |
168 | ¨ | ¨ | ¨ | diéresis | |
169 | © | © | © | muestra de los derechos | |
170 | ª | ª | ª | Indicador ordinal femenino | |
171 | « | « | « | apunta hacia la izquierda comilla doble ángulo | |
172 | no firme | ||||
173 | | | | guión de separación | |
174 | ® | ® | ® | signo registrado | |
175 | ¯ | ¯ | ¯ | macrón | |
176 | ° | ° | ° | signo de grado | |
177 | ± | ± | ± | más-menos signo | |
178 | ² | ² | ² | superíndice dos | |
179 | ³ | ³ | ³ | superíndice tres | |
180 | acento agudo | ||||
181 | µ | µ | µ | señal de micro | |
182 | signo Pilcrow | ||||
183 | · | · | · | punto medio | |
184 | . | . | . | cedilla | |
185 | ª | ª | ª | un superíndice | |
186 | Indicador ordinal masculino | ||||
187 | » | » | » | apunta hacia la derecha ángulo doble comilla | |
188 | 1/4 | 1/4 | 1/4 | fracción vulgar cuarto | |
189 | 1/2 | 1/2 | 1/2 | fracción vulgar una media | |
190 | 3/4 | 3/4 | 3/4 | fracción vulgar tres cuartos | |
191 | signo de interrogación invertido | ||||
192 | À | À | À | Una letra mayúscula latina con grave | |
193 | Á | Á | Á | letra mayúscula A con América aguda | |
194 | Â | Â | Â | Una letra mayúscula latina con acento circunflejo | |
195 | Ã | Ã | Ã | Una letra mayúscula latina con tilde | |
196 | Ä | Ä | Ä | Una letra mayúscula latina con diéresis | |
197 | Å | Å | Å | Una letra mayúscula latina con el anillo superior | |
198 | Æ | Æ | Æ | América letra mayúscula AE | |
199 | C | C | C | Letra latina mayúscula C con cedilla | |
200 | E | E | E | Letra latina mayúscula E con la tumba | |
201 | E | E | E | Letra latina mayúscula E con aguda | |
202 | E | E | E | Letra latina mayúscula E con acento circunflejo | |
203 | E | E | E | Letra latina mayúscula E con diéresis | |
204 | I | I | I | letra mayúscula Latín I con grave | |
205 | I | I | I | letra mayúscula I con América aguda | |
206 | I | I | I | letra mayúscula Latín I con acento circunflejo | |
207 | I | I | I | letra mayúscula América I con diéresis | |
208 | Ð | Ð | Ð | América letra mayúscula Eth | |
209 | Ñ | Ñ | Ñ | letra mayúscula América N con tilde | |
210 | O | O | O | Letra latina O mayúscula con grave | |
211 | O | O | O | Letra latina O mayúscula con aguda | |
212 | O | O | O | Letra latina O mayúscula con acento circunflejo | |
213 | O | O | O | Letra latina O mayúscula con tilde | |
214 | O | O | O | Letra latina O mayúscula con diéresis | |
215 | × | × | × | signo de multiplicación | |
216 | Ø | Ø | Ø | Letra latina O mayúscula con un accidente cerebrovascular | |
217 | U | U | U | letra mayúscula T con grave América | |
218 | U | U | U | letra mayúscula U con América aguda | |
219 | U | U | U | letra mayúscula América U con acento circunflejo | |
220 | U | U | U | letra mayúscula América U con diéresis | |
221 | Y | Y | Y | letra mayúscula América Y con aguda | |
222 | Þ | Þ | Þ | América letra mayúscula Thorn | |
223 | ß | ß | ß | Letra latina aguda s | |
224 | a | a | a | Letra latina pequeña una con grave | |
225 | a | a | a | Letra latina pequeña con una aguda | |
226 | a | a | a | Letra latina con acento circunflejo una pequeña | |
227 | a | a | a | Letra latina pequeña con una tilde | |
228 | a | a | a | Letra latina pequeña con una diéresis | |
229 | a | a | a | Letra latina pequeño un anillo con arriba | |
230 | a | a | a | América pequeña letra ae | |
231 | c | c | c | Letra latina c con cedilla | |
232 | e | e | e | Letra latina e minúscula con grave | |
233 | e | e | e | Letra latina e minúscula con aguda | |
234 | e | e | e | Letra latina e minúscula con acento circunflejo | |
235 | e | e | e | Letra latina e minúscula con diéresis | |
236 | i | i | i | Letra latina i con grave | |
237 | i | i | i | Letra latina i con aguda | |
238 | i | i | i | Letra latina i con acento circunflejo | |
239 | i | i | i | Letra latina i con diéresis | |
240 | América pequeña letra eth | ||||
241 | n | n | n | América pequeña letra n con tilde | |
242 | o | o | o | Letra latina o con grave | |
243 | o | o | o | Letra latina o con aguda | |
244 | o | o | o | Letra latina o minúscula con acento circunflejo | |
245 | o | o | o | Letra latina o minúscula con tilde | |
246 | o | o | o | Letra latina o minúscula con diéresis | |
247 | ÷ | ÷ | ÷ | signo de división | |
248 | Letra latina o con un accidente cerebrovascular | ||||
249 | u | u | u | Letra latina u con grave | |
250 | u | u | u | Letra latina u con aguda | |
251 | u | u | u | Letra latina con acento circunflejo | |
252 | u | u | u | Letra latina u con diéresis | |
253 | y | y | y | América pequeña letra y con aguda | |
254 | þ | þ | þ | América pequeña letra de la espina | |
255 | y | y | y | América pequeña letra y con diéresis |
El conjunto de caracteres ASCII
ASCII utiliza los valores de 0 a 31 (and 127) para caracteres de control.
ASCII utiliza los valores de 32 a 126 para las letras, dígitos y símbolos.
ASCII no utiliza los valores de 128 y 255.
El juego de caracteres ANSI (Windows-1252)
ANSI es idéntica a ASCII para los valores de 0 a 127.
ANSI tiene su propio grupo de caracteres para los valores de 128 a 159.
ANSI es idéntica a UTF-8 para los valores de 160 a 255.
El conjunto de caracteres ISO-8859-1
8859-1 es idéntica a ASCII para los valores de 0 a 127.
8859-1 no utiliza los valores de 128 A 159.
8859-1 es idéntica a UTF-8 para los valores de 160 a 255.
El conjunto de caracteres UTF-8
UTF-8 es idéntica a ASCII para los valores de 0 a 127.
UTF-8 no utiliza los valores de 128 A 159.
UTF-8 es idéntica a ambos ANSI y 8859-1 para los valores de 160 a 255.
UTF-8 continúa desde el valor 256 con más de 10 000 caracteres diferentes.
Para un vistazo más de cerca, estudiar nuestra completa de caracteres HTML Conjunto de referencia .