Codificación de caracteres HTML

Para desplegar una página web correctamente, el Navegador Web debe conocer que codificación de caracteres esta establecida para la página para usar esta para desplegar los caracteres correctamente.

¿Que es una Codificación de Caracteres?

ASCII fue el primer estandard de codificación de caracteres. ASCII definio 128 diferentes caracteres alfanúmericos que pueden usarse en internet: números (del 0 al 9), letras (de la A a la Z), y algunos caracteres especiales ( ! $ + - ( ) @ < > ).

ANSI (Windows-1252) fue congunto original de caracteres de Windows, con soporte para 256 diferentes códidos de caracteres.

ISO-8859-1 fue el conjunto de caracteres por defecto para HTML 4. Este conjunto de caraacteres también soportaba 256 códigos de caracteres. Esto debido a que ANSI y ISO-8859-1 estaba limitado, HTML 4 también soportaba UTF-8.

UTF-8 (Unicode) cubre casi todos los caracteres y símbolos en el mundo.

La códificación de caracteres por defecto para el HTML5 es UTF-8.

El atributo charset HTML

Para desplegar una página HTML correctamente, un Navegador Web deben conocer la codificación establecida en la página, que es especificada en una etiqueta <meta>:

HTML 4:

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

HTML 5:

<meta charset="UTF-8">

Si un navegador detecta ISO-8859-1 en una página web, su valor predeterminado es ANSI, porque ANSI es idéntico a ISO-8859-1, excepto que ANSI tiene 32 caracteres adicionales.