Des caractères set en html
Il existe de nombreux jeux de caractères qui ont été utilisés dans les versions antérieures de HTML. Ici, nous discuterons de tout le jeu de caractères précédemment et actuellement pris en charge.
Jeu de caractères ASCII
L'ASCII est un jeu de caractères 7 bits qui permet à 128 caractères de représenter les termes de langue anglaise dans un format compréhensible informatique. Certaines caractéristiques de l'ASCII sont décrites ci-dessous:
- Les chiffres (0-9) et toutes les 26 lettres alphabétiques peuvent être représentées en utilisant ASCII
- Tous les jeux de caractères utilisés dans HTML sont basés sur ASCII
La principale limitation du jeu de caractères ASCII est qu'elle ne soutenait que 128 caractères qui ne pourraient prendre en charge que les termes de langue anglaise (alphabets), les chiffres (0-9) et les marques de ponctuation. Dépendant de la langue et limité.
Jeu de caractères ISO 8859-1
D'après les versions récentes, HTML 4.0 est venu avec l'ISO-8859-1 comme jeu de caractères par défaut. L'ISO 8859-1 est une extension du jeu de caractères ASCII et il représente les caractères en code 8 bits. Il peut représenter 256 caractères, ce qui en fait également un schéma d'encodage dépendant de la langue. Un jeu de caractères est défini dans la balise Meta du document HTML et le code suivant aidera à utiliser l'ISO 8859-1 dans votre document HTML:
Note: Bien que HTML5 contienne un jeu de caractères UTF-8, il peut également être utilisé avec ISO-8859-1 en utilisant la ligne suivante dans votre étiquette de tête.
Jeu de caractères UTF-8
Le jeu de caractères Unicode comprend les valeurs décimales qui représentent les caractères, les symboles et les marques de ponctuation. Ces valeurs décimales basées sur Unicode sont ensuite converties en format compréhensible par ordinateur à l'aide de UTF-8, UTF-16 ou UTF-32. Cependant, l'UTF-8 est recommandé pour les pages Web car il couvre tous les caractères / symboles / marques de ponctuation qui peuvent être utilisées dans un document HTML.
Voici les caractéristiques saillantes de l'UTF-8
- Le dernier jeu de caractères est venu par défaut pour HTML5.
- Il peut également être ajouté à la version HTML4.
- L'UTF-8 fonctionne sur la base d'ASCII et les 128 premiers caractères de l'UTF-8 sont les mêmes que d'ASCII.
- Prend en charge tous les symboles, caractères et marques de ponctuation utilisés dans le monde entier
- Convertit les nombres / caractères / symboles / marques de ponctuation en un à quatre octets
D'après la discussion ci-dessus, l'importance de l'UTF-8 a fait un terrain solide pour l'obsoletion des ensembles ASCII et ISO-8859-1.
Note: L'Unicode.org fournit tous les unicodes des personnages, symboles, emojis, marques de ponctuation.
Comment utiliser UTF-8 dans HTML4
Le HTML4 est venu avec ISO-889-1 comme jeu de caractères par défaut. Cependant, vous pouvez ajouter le jeu UTF-8-Charge dans HTML4 en utilisant la balise Meta suivante.
Comment utiliser ISO-8859-1 dans HTML5
Comme le jeu de caractères par défaut de HTML5 est UTF-8 qui surpasse les anciens jeux de caractères. Cependant, vous pouvez ajouter le jeu de caractères ISO-8859-1 dans votre document HTML en utilisant la ligne suivante dans notre étiquette de tête.
Conclusion
Le jeu de caractères convertit les symboles, les caractères ou toute touche à un format lisible par ordinateur. Cet article donne un aperçu des jeux de caractères utilisés dans HTML à partir des versions antérieures au dernier HTML5. L'ASCII est le jeu de caractères le plus ancien avec un support limité pour les caractères et la langue (seule langue anglaise). Plus tard, ASCII a été étendu à 256 caractères avec un support 8 bits pour construire un nouveau jeu de caractères nommé ISO-8859-1. L'ISO-8859-1 est le jeu de caractères par défaut pour HTML4 mais offre une prise en charge limitée des caractères (256). L'UTF-8 couvre toutes les lacunes de l'ISO-8859-1 et donc UTF-8 est venu comme un jeu de caractères par défaut dans HTML5.