SELFHTML/Quickbar  Paramètres internationaux


Jeux de caractères (famille iso-8859 et autres)

Cette page est un document avec du texte et des informations

 Les jeux de caractères iso-8859
 Liste des jeux de caractères iso-8859
 Autres jeux de caractères

 

Les jeux de caractères iso-8859

La famille iso-8859-Familie a été développée par European Computer Manufacturer's Association (ECMA). Il s'agit d'une collection de jeux de caractères pour les écritures alphabétiques. En font partie les écritures latines sur lesquelles sont fondées la plupart des langues de l'Europe de l'ouest et d'Amérique ou aussi les écritures cyrilliques.

Tous les jeux de caractères de cette famille se basent sur une représentation d'un octet par signe. Ce qui veut dire que tous les jeux de caractères comprennent 256 caractères possibles. Pour tous les jeux de caractères, les 128 premiers signes (les signes entre 0 et 127) sont identiques à ceux du jeu de caractères ASCII. Ce qui a l'avantage que les lettres latines courantes majuscules et minuscules, les chiffres arables et les signes spéciaux courants comme la ponctuation et les signes commerciaux soient toujours disponibles dans tous ces jeux de caractères.

jeu de caractères ASCII

Ci-dessus est représenté le jeu de caractères ASCII. Les signes de ce jeu de caractères pouvant être représentés ont des valeurs comprises entre 32 et 127. La valeur 32 est l'espace. Tous les jeux de caractères iso-8859 contiennent ce jeu de caractères.

Comment lire ce tableau de jeu de caractères et les suivants:
Vous trouvez la valeur d'un signe en additionnant les valeurs du titre de colonne et du titre de ligne pour le signe concerné. Un K majuscule a par exemple dans ce tableau une valeur de ligne de 70 et une valeur de colonne 5. Ce qui donne la valeur 75 pour ce signe. Les valeurs des caractères peuvent jouer un rôle pour l'  utilisation de jeux de caractères et d'unicodes en HTML.

Comme pour le jeu de caractères ASCII qui voit ses 32 premiers caractères (valeurs des signes de 0 à 31) réservés pour des caractères de contrôle les jeux de caractères étendus de la famille iso font aussi l'économie d'une plage de signes. Il s'agit des 32 premiers signes au delà du domaine ASCII, donc des valeurs de caractères de 128 à 159. Les tableaux des différents jeux de caractères plus bas représentent pour cette raison les valeurs de signes restantes de 160 à 255. Le signe avec la valeur 160 représentent dans tous ces jeux de caractères un espace imposé.

Beaucoup des jeux de caractères de la famille iso-8859 se recouvrent. C'est intentionnel. Les jeux de caractères sont si optimisés que le plus possible d'écritures sont couvertes avec un jeu de caractères chacune. Les caractères qui existent dans plusieurs jeux de caractères de la famille iso-8859, ont en règle générale toujours la même valeur, c'est à dire qu'ils se trouvent toujours au même endroit dans les différents jeux de caractères.

Six des jeux de caractères iso-8859 se réfèrent à des écritures qui pour l'essentiel sont fondées sur l'écriture latine. Ces jeux de caractères sont nommés pour cette raison Latin-1 à Latin-6.


 

Liste des jeux de caractères iso-8859

Les tableaux suivants montrent les différents jeux de caractères de la famille iso-8859. Comment vous pouvez mettre en service ces jeux de caractères en HTML est expliqué dans la partie  mention de jeu de caractères comme mention Meta.

Iso-8859-1 ("Latin-1")

Ce jeu de caractères contient les signes spécifiques pour les langues de l'Europe de l'ouest et d'Amérique. Il convient aux langues suivantes: albanais, danois, allemand, anglais, finlandais, français, galicien, irlandais, islandais, italien, catalan, néerlandais, norvégien, portugais, suédois et espagnol. Il n'y manque que des signes distincts comme le "ij" néerlandais ou les guillemets basses allemandes.

iso 8859-1

Iso-8859-2 ("Latin-2")

Ce jeu de caractères contient les signes spécifiques pour la plupart des langues de l'Europe centrale et slaves. Il convient aux langues suivantes: croate, polonais, roumain, slovaque, slovène, tchèque et hongrois.

iso 8859-2

Iso-8859-3 ("Latin-3")

Ce jeu de caractères convient aux langues: Espéranto, galicien, malte et turc.

iso 8859-3

Iso-8859-4 ("Latin-4")

Ce jeu de caractères contient quelques uns des signes des langues suivantes: estonien, letton et lituanien. Comparez aussi ce jeu de caractères avec iso 8859-10, qui est très semblable.

iso 8859-4

Iso-8859-5

Ce jeu de caractères contient des signes cyrilliques. Il couvre largement les langues suivantes: bulgare, macédonien, russe, serbe et ukrainien.

iso 8859-5

Iso-8859-6

Ce jeu de caractères contient des signes de l'écriture arabe. La représentation des signes dans le tableau ci-après est pourtant "abstraite", étant donné que les signes varient dans la pratique de l'écriture selon qu'ils sont placés au début, au milieu ou à la fin d'un mot ou seuls. L'arabe a besoin d'un logiciel informatique spécial pour sa représentation étant donné que la direction de l'écriture (de droite à gauche) n'est normalement pas affichable sur les ordinateurs d'aujourd'hui.

iso 8859-6

Iso-8859-7

Ce jeu de caractères contient les signes de l'écriture grecque moderne.

iso 8859-7

Iso-8859-8

Ce jeu de caractères contient les signes de l'écriture hébraïque. Comme pour l'écriture arabe un logiciel informatique est indispensable pour la représentation de cette écriture, étant donné que la direction de l'écriture (de droite à gauche) n'est normalement pas affichable sur les ordinateurs d'aujourd'hui.

iso 8859-8

Iso-8859-9 ("Latin-5")

Ce jeu de caractères est conçu spécialement pour le turc. Il est basé sur le jeu de caractères iso 8859-1, mais contient à la place des signes spéciaux islandais les signes turcs.

iso 8859-9

Iso-8859-10 ("Latin-6")

Ce jeu de caractères contient des signes spéciaux pour les langues suivantes: Groenlandais (Inuit) et lapon (Sami).

iso 8859-10

 

Autres jeux de caractères

Il y a quantité d'autres jeux de caractères en partie déjà plus anciens qui définissent des conventions pour différentes écritures ou familles d'écritures, souvent spécifiques au pays. Certains d'entre eux utilisent aussi 2 octets de large, donc des valeurs numériques de signes. Ici un petit choix:

ISO-2022-JP - jeu de caractères japonais
greek7-old - jeu des caractères pour grec ancien
DIN_66003 - jeu de caractères allemand
DS_2089 - jeu de caractères danois
KOI8-R - jeu de caractères cyrillique (avant tout pour le russe)
GB2312 - jeu de caractères chinois

Du point de vue de HTML il est important de savoir quels jeux de caractères peuvent y être employés officiellement. Vous trouverez une liste des mentions de jeux de caractères autorisées dans la partie  mention de jeu de caractères comme mention Meta.

après: Le système unicode
avant: Ordinateur et langage écrit
 

SELFHTML/Quickbar  Paramètres internationaux

© 1998 Stefan Münz / © 2001 Traduction  Serge François, 13405@free.fr