SELFHTML/Quickbar  Paramètres internationaux


Utiliser les jeux de caractères et les unicodes en HTML

Cette page est un document avec du texte et des informations

 Jeux de caractères comme mentions Meta
 Unicodes comme mentions numériques

 

HTML4.0 Jeux de caractères comme mentions Meta

Quand vous utilisez dans un fichier HTML un langage script pour lequel beaucoup de signes n' appartiennent pas au  jeu de caractères ASCII, il suffit à partir de la version 4.0 du standard HTML de noter pour cela une seule commande dans l'entête du fichier. Si vous établissez le fichier HTML avec un éditeur qui utilise également ce jeu de caractères, vous pouvez par exemple entrer du cyrillique ou de l'islandais directement sur un clavier correspondant, sans devoir utiliser les  Unicodes ou les  signes nommés pour chacun des signes spécifiques à la langue.

Exemple:

<head>
<title>Titre du fichier</title>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
</head>

Explication:

La commande correspondante en HTML est mentionnées à l'aide d'une  mention Meta (<meta...>) dans l'entête de fichier. Notez la mention avec toutes les guillemets et les points virgules exactement comme dans l'exemple ci-dessus. Mettez simplement derrière charset= le nom du jeu de caractères désiré. Une vue d'ensemble des noms valides de jeux de caractères peut être trouvée sur le WWW: la  liste des jeux de caractères homologués, publiée par IANA. Les noms de jeux de caractères peuvent selon cette liste comporter jusqu'à 40 signes ASCII imprimables. Les majuscules et les minuscules ne sont pas différenciées.

La  la famille de jeux de caractères iso 8859 a pris une importance particulière. Avec la mention du jeu de caractères iso-8859-1 par exemple, vous déterminez le jeu de caractères Western Latin-1, qui comprend les caractères particuliers allemands. En mentionnant ce jeu de caractères, rien ne s'oppose d'après HTML 4.0 à entrer du texte dans un fichier HTML sans en remplacer les signes spéciaux par leurs transcriptions. À condition toutefois que le logiciel d'édition utilise le même jeu de caractères.

Attention:

Déterminer un jeu de caractères dans l'entête de fichier aide bien un navigateur WWW supportant le HTML 4.0 à reconnaître d'après quel jeu de caractères il doit traiter les valeurs de signes contenus dans le fichier. Un affichage correct du fichier chez l'utilisateur n'est cependant possible que si celui-ci a chargé une police qui soutient le jeu de caractères correspondant. En outre l'utilisateur doit avoir affecté dans les réglages de son navigateur, la police correspondante au jeu de caractères correspondant.

Des navigateurs WWW plus anciens, même Netscape jusqu'à la version 3.x ou l' Explorer Internet MS jusqu'à V3.x, n'interprètent pas encore l'information Meta pour déterminer le jeu de caractères.

 

HTML4.0 Unicodes comme mentions numériques

À partir de la version 4.0 du langage, HTML utilise le jeu de caractères universel (Universal Character Set - UCS) d'après le standard ISO 10646. Ce standard se fonde de son côté sur la version 2.0 du  système unicode.

Vous pouvez à partir du standard HTML 4.0 noter dans un fichier HTML des signes au choix extraits de l'UCS ou du système unicode avec la mention numérique correspondante.

Exemples:

&#252;    <!-- lettre "ü" en décimal -->
&#xFC;    <!-- lettre "ü" en hexadécimal -->

Explication:

Toutes les notations numériques de signes distincts commencent par le ET commercial &, suivi du signe dièse #. Vous pouvez noter à la suite le nombre du signe désiré. La mention peut avoir lieu soit en décimal, soit en hexadécimal. Les chiffres décimaux sont notés normalement, pour les signes hexadécimaux doit figurer à la suite du signe dièse un x. Les chiffres hexadécimaux sont composés des chiffres décimaux de 0 à 9 et des chiffres "artificiels" A pour 10, B pour 11, C pour 12, D pour 13, E pour 14 et F pour 15.

Les représentations et l'affectation numérique de tous les signes contenus dans le système unicode peuvent être appelées par la partie traitant de:  les signes unicodes.

Tuyau:

Pour transformer des valeurs décimales en valeurs hexadécimales, vous pouvez utilisez le  SELFHTML décodeur décimal/hexadécimal.

après: Signes nommés en HTML
avant: Le système unicode
 

SELFHTML/Quickbar  Paramètres internationaux

© 1998 Stefan Münz / © 2001 Traduction  Serge François, 13405@free.fr