Codage valide des caractères Windows illégaux en HTML et XHTML

Openweb.eu.org > Articles  > Codage valide des caractères Windows illégaux en HTML et XHTML

Abstract

Cette page présente les caractères codés de 128 à 159 - propres à Windows, mais invalides selon les spécifications HTML 4+ et XHTML, ainsi que leurs codes de substitution valides.

Article

Cette page présente les caractères codés de € à Ÿ - propres à Windows, mais invalides selon les spécifications HTML 4+ et XHTML .

Encodés incorrectement comme dans la première colonne de résultat du tableau ci-dessous, ces caractères ne seront pas restitués correctement sur d'autres plates-formes que Windows (Linux...), où, au mieux, un caractère générique sera affiché (fréquemment un carré vide).

Ils doivent donc être remplacés par leur équivalent en entités numériques ou entités caractères qui, elles, sont valides et seront correctement restituées.

Ces deux solutions ne sont toutefois pas équivalentes :

  • aucune des entités caractères ne s'affiche dans Netscape 4 ;
  • le résultat obtenu avec les références numériques est indépendant du Character Encoding (ISO-8859-1 ou UTF-8), puisque ces codes relèvent du Character Set ISO-10646 utilisé en HTML et en XHTML.
caractères invalides et leurs équivalents
codage invalide Entité valide Référence numérique valide résultat Remarques
€ &euro € Euro

‚ ‚ ‚ apostrophe anglaise basse
ƒ ƒ ƒ ƒ florin, forte musical
„ „ „ guillemet anglais bas
… … … points de suspension
† † † obèle, dague, croix (renvoi de notes de bas de page)
‡ ‡ ‡ double croix
ˆ ˆ ˆ ˆ accent circonflexe
‰ ‰ ‰ pour mille
Š Š Š Š S majuscule avec caron (accent circonflexe inversé) utilisé en tchèque
‹ ‹ ‹ guillemet simple allemand et suisse, parenthèse angulaire ouvrante
Œ Œ Œ Œ Ligature o-e majuscule (absente de la norme ISO-8859-1 pour une raison aberrante…)

Ž Ž Ž Z majuscule avec caron (accent circonflexe inversé) utilisé en tchèque. Présent dans le Character Encoding ISO-8859-2


‘ ‘ ‘ guillemet anglais simple ouvrant(utilisé dans les guillemets doubles)
’ ’ ’ guillemet anglais simple fermant(utilisé dans les guillemets doubles)
“ “ “ guillemets anglais doubles ouvrants
” ” ” guillemets anglais doubles fermants
• • • boulet, utiliser plutôt des listes à puces
– – – tiret demi-cadratin (incise), voir The Trouble With EM 'n EN
— — — tiret cadratin (dialogue), voir The Trouble With EM 'n EN
˜ ˜ ˜ ˜ tilde
™ ™ ™ marque déposée
š š š š s minuscule avec caron (accent circonflexe inversé) utilisé en tchèque
› › › guillemet simple allemand et suisse, parenthèse angulaire fermante
œ œ œ œ Ligature o-e minscule (absente de la norme ISO-8859-1 pour une raison aberrante…)

ž ž ž z minuscule avec caron (accent circonflexe inversé) utilisé en tchèque. Présent dans le Character Encoding ISO-8859-2
Ÿ Ÿ Ÿ Ÿ Y majuscule avec trema, présent en français dans quelques noms propres (PDF).

À propos de cet article

  • Openweb.eu.org
  • Profil : Expert
  • Technologie : (X)HTML
  • Auteur :
  • Publié le :
  • Mise à jour : 22 mai 2008

Vos commentaires

modération a priori

Attention, votre message n’apparaîtra qu’après avoir été relu et approuvé.

Qui êtes-vous ?
Ajoutez votre commentaire ici

Ce champ accepte les raccourcis SPIP {{gras}} {italique} -*liste [texte->url] <quote> <code> et le code HTML <q> <del> <ins>. Pour créer des paragraphes, laissez simplement des lignes vides.

Suivre les commentaires : RSS 2.0 | Atom