SELFHTML/Quickbar
Paramètres internationaux
![]() |
Utiliser les jeux de caractères et les unicodes en HTML |
![]() |
|
![]() |
Quand vous utilisez dans un fichier HTML un langage script pour lequel
beaucoup de signes n' appartiennent pas au jeu
de caractères ASCII, il suffit à partir de la version 4.0 du
standard HTML de noter pour cela une seule commande dans l'entête du
fichier. Si vous établissez le fichier HTML avec un éditeur qui utilise
également ce jeu de caractères, vous pouvez par exemple entrer du cyrillique
ou de l'islandais directement sur un clavier correspondant, sans devoir utiliser
les
Unicodes
ou les
signes
nommés pour chacun des signes spécifiques à la langue.
<head> <title>Titre du fichier</title> <meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1"> </head> |
La commande correspondante en HTML est mentionnées à l'aide d'une mention
Meta (<meta...>) dans l'entête de fichier. Notez la
mention avec toutes les guillemets et les points virgules exactement comme dans
l'exemple ci-dessus. Mettez simplement derrière charset= le nom du
jeu de caractères désiré. Une vue d'ensemble des noms valides de jeux de
caractères peut être trouvée sur le WWW: la
liste
des jeux de caractères homologués, publiée par IANA. Les noms de jeux
de caractères peuvent selon cette liste comporter jusqu'à 40 signes ASCII
imprimables. Les majuscules et les minuscules ne sont pas différenciées.
La la
famille de jeux de caractères iso 8859 a pris une importance
particulière. Avec la mention du jeu de caractères iso-8859-1 par
exemple, vous déterminez le jeu de caractères Western Latin-1, qui comprend
les caractères particuliers allemands. En mentionnant ce jeu de caractères,
rien ne s'oppose d'après HTML 4.0 à entrer du texte dans un fichier HTML
sans en remplacer les signes spéciaux par leurs transcriptions. À condition
toutefois que le logiciel d'édition utilise le même jeu de caractères.
Déterminer un jeu de caractères dans l'entête de fichier aide bien un navigateur WWW supportant le HTML 4.0 à reconnaître d'après quel jeu de caractères il doit traiter les valeurs de signes contenus dans le fichier. Un affichage correct du fichier chez l'utilisateur n'est cependant possible que si celui-ci a chargé une police qui soutient le jeu de caractères correspondant. En outre l'utilisateur doit avoir affecté dans les réglages de son navigateur, la police correspondante au jeu de caractères correspondant.
Des navigateurs WWW plus anciens, même Netscape jusqu'à la version 3.x ou l' Explorer Internet MS jusqu'à V3.x, n'interprètent pas encore l'information Meta pour déterminer le jeu de caractères.
![]() ![]() |
À partir de la version 4.0 du langage, HTML utilise le jeu de
caractères universel (Universal Character Set - UCS) d'après le standard ISO 10646.
Ce standard se fonde de son côté sur la version 2.0 du système
unicode.
Vous pouvez à partir du standard HTML 4.0 noter dans un fichier HTML des signes au choix extraits de l'UCS ou du système unicode avec la mention numérique correspondante.
ü <!-- lettre "ü" en décimal --> ü <!-- lettre "ü" en hexadécimal --> |
Toutes les notations numériques de signes distincts commencent par le ET commercial &, suivi du signe dièse #. Vous pouvez noter à la suite le nombre du signe désiré. La mention peut avoir lieu soit en décimal, soit en hexadécimal. Les chiffres décimaux sont notés normalement, pour les signes hexadécimaux doit figurer à la suite du signe dièse un x. Les chiffres hexadécimaux sont composés des chiffres décimaux de 0 à 9 et des chiffres "artificiels" A pour 10, B pour 11, C pour 12, D pour 13, E pour 14 et F pour 15.
Les représentations et l'affectation numérique de tous les signes contenus
dans le système unicode peuvent être appelées par la partie traitant
de: les
signes unicodes.
Pour transformer des valeurs décimales en valeurs hexadécimales, vous
pouvez utilisez le SELFHTML
décodeur décimal/hexadécimal.
![]() | |
après:![]() |
![]() |
avant:![]() |
![]() |
SELFHTML/Quickbar
Paramètres internationaux
Serge François, 13405@free.fr