Contrôles C0 et latin de base
Exemple : la lettre A
Le codage Unicode est un standard international qui attribue un numéro unique à chaque caractère ou symbole utilisé dans toutes les langues du monde, permettant ainsi leur représentation et leur échange sur tous les systèmes informatiques.
Le numéro unique attribué à chaque caractère ou symbole dans le standard Unicode est un nombre entier appelé le point de code. Il permet d’identifier et de représenter précisément chaque caractère ou symbole, quelle que soit la langue ou le système d’écriture, sous forme numérique (en décimal ou en hexadécimal). En plus du point de code, le standard Unicode associe à chaque caractère ou symbole un nom unique.
En Unicode, un bloc de codes est une plage de points de code consécutifs réservée à un groupe de caractères partageant une même origine ou fonction (par exemple : alphabet latin, cyrillique, symboles mathématiques, etc.). Chaque bloc porte un nom officiel (défini par la norme ISO/CEI 10646) et permet d’organiser les caractères par familles ou systèmes d’écriture, facilitant leur classification et leur utilisation dans les logiciels et les bases de données.
Quelques exemples de caractères et symboles Unicode (pour chaque caractère est donné son nom officiel, son graphème (ou glyph) qui correspond à sa représentation visulle, son point de code (en décimal et en hexadécimal) et le bloc de codes auquel le caractère ou symbole se rattache.
| A majuscule | |
|---|---|
| A | 1234 (décimal) |
| U+0041 (hexadécimal) | |
| bloc de codes | C0+latin1 de base |
| e accent circonflexe | |
|---|---|
| ê | 234 (décimal) |
| U+00EA (hexadécimal) | |
| bloc de codes | C1+Supplément latin1 |
| b majuscule (cyrillique) | |
|---|---|
| Б | 1041 (décimal) |
| U+0411 (hexadécimal) | |
| bloc de codes | Cyrillique |
| Teh (lettre arabe) | |
|---|---|
| ت | 1578 (décimal) |
| U+062A (hexadécimal) | |
| bloc de codes | Arabe |
| Quantificateur universel | |
|---|---|
| ∀ | 8704 (décimal) |
| U+2200 (hexadécimal) | |
| bloc de codes | Opérateurs math. |
| Bonhomme de neige | |
|---|---|
| ☃ | 9731 (décimal) |
| U+2603 (hexadécimal) | |
| bloc de codes | Symboles Divers |
Vous trouverez dans ce qui suit quelques exemples des blocs de codes Unicode.
Exemple : la lettre A
Exemple : la lettre é
Exemple : la lettre Б
Exemple : la lettre ت
Exemple : l'opérateur ∀
Exemple : le symbole ☃