Codage Unicode des caractères

Le codage Unicode est un standard international qui attribue un numéro unique à chaque caractère ou symbole utilisé dans toutes les langues du monde, permettant ainsi leur représentation et leur échange sur tous les systèmes informatiques.

Le numéro unique attribué à chaque caractère ou symbole dans le standard Unicode est un nombre entier appelé le point de code. Il permet d’identifier et de représenter précisément chaque caractère ou symbole, quelle que soit la langue ou le système d’écriture, sous forme numérique (en décimal ou en hexadécimal). En plus du point de code, le standard Unicode associe à chaque caractère ou symbole un nom unique.

En Unicode, un bloc de codes est une plage de points de code consécutifs réservée à un groupe de caractères partageant une même origine ou fonction (par exemple : alphabet latin, cyrillique, symboles mathématiques, etc.). Chaque bloc porte un nom officiel (défini par la norme ISO/CEI 10646) et permet d’organiser les caractères par familles ou systèmes d’écriture, facilitant leur classification et leur utilisation dans les logiciels et les bases de données.

Exemples de codages

Quelques exemples de caractères et symboles Unicode. Pour chaque caractère est donné son nom officiel, son graphème (ou glyph) qui correspond à sa représentation visulle, son point de code (en décimal et en hexadécimal) et le bloc de codes auquel le caractère ou symbole se rattache.

Exemples de blocs Unicode

Vous trouverez dans ce qui suit quelques exemples des blocs de codes Unicode.

Contrôles C0 et latin de base

Table des caractères Unicode U+0000 à U+007F (0 à 127 en décimal)

Exemple : la lettre A

Contrôles C1 et supplément latin-1

Table des caractères Unicode U+0080 à U+00FF (128 à 255 en décimal)

Exemple : la lettre ê

Cyrillique

Table des caractères Unicode U+0400 à U+04FF. (1024 à 1279 en décimal)

Exemple : la lettre Б

Arabe

Table des caractères Unicode U+0600 à U+06FF. (1536 à 1791 en décimal)

Exemple : la lettre ت

Operateurs mathématiques

Table des caractères Unicode U+0600 à U+06FF. (1536 à 1791 en décimal)

Exemple : l'opérateur ∀

Symboles divers

Table des caractères Unicode U+2600 à U+26FF. (9728 à 9983 en décimal)

Exemple : le symbole ☃