Introduction aux jeux de caractères - commentaires Introduction aux jeux de caractères 2019-02-04T22:41:33Z https://openweb.eu.org/articles/jeux_caracteres#comment3022 2019-02-04T22:41:33Z <p>7 bits pour coder un caractère c'est 2⁷-1 = 127 possibilités de caractères plutôt que 128.</p> Introduction aux jeux de caractères 2017-10-16T08:49:33Z https://openweb.eu.org/articles/jeux_caracteres#comment2928 2017-10-16T08:49:33Z <p>Bonjour, félicitations pour vos informations. Pourriez-vous m'informer comment je peux m'y prendre afin de corriger les é,è ect.. remplacés par des ?. sur le site que j'ai créé et ce problème est intervenu il y a environ trois mois, suite à une mise à jour , je suppose.<br class="autobr" /> Les erreurs de sécurité mentionnées, sont SEC7113 et HTML1114.<br class="autobr" /> Merci de votre patience, je ne suis pas un pro en informatique. Bonne journée.</p> Introduction aux jeux de caractères 2016-10-10T12:15:03Z https://openweb.eu.org/articles/jeux_caracteres#comment2870 2016-10-10T12:15:03Z <p>èutyttytytyt</p> Introduction aux jeux de caractères 2016-10-10T12:14:24Z https://openweb.eu.org/articles/jeux_caracteres#comment2869 2016-10-10T12:14:24Z <p>bonjour mesdames</p> Introduction aux jeux de caractères 2015-10-20T19:44:50Z https://openweb.eu.org/articles/jeux_caracteres#comment2765 2015-10-20T19:44:50Z <p>Y-a-t-il d'autres jeux de caractères ou langages issus d'un <a href="http://accespoint.online.fr/index.php/site/details/6924/alphabet-origine-et-histoire-des-mots" class="spip_out" rel='nofollow external'>alphabet</a> autre que celui cyrillique ?</p> Introduction aux jeux de caractères 2015-01-05T02:10:24Z https://openweb.eu.org/articles/jeux_caracteres#comment2638 2015-01-05T02:10:24Z <p>Pour trouver tous les caractères unicodes voiçi un site utile :<br class="autobr" /> <a href="http://www.isthisthingon.org/unicode/index.phtml" class="spip_url spip_out auto" rel="nofollow external">http://www.isthisthingon.org/unicode/index.phtml</a></p> Introduction aux jeux de caractères 2015-01-05T02:07:04Z https://openweb.eu.org/articles/jeux_caracteres#comment2637 2015-01-05T02:07:04Z <p>à Jean-Marie Galliot</p> <p>1)Avant-propos</p> <p>ISO-8859-1 11101001 E9 <br class="autobr" /> UTF-8 11000011 10101001 C3 A9<br class="autobr" /> C3 en Latin-1 Ã<br class="autobr" /> A9 en Latin-1 ©<br class="autobr" /> Une page UTF-8 contenant é (C3A9) devient en Latin-1 é</p> <p>exemple : <br class="autobr" /> accélérer(UTF-8) devient accélérer (Latin-1)</p> <hr class="spip" /> <p>2) Commentaire sur "Exemple de code" ? (3)<br class="autobr" /> Dans le tableau on a <br class="autobr" /> 11100001 10111010 10111001 → E1BAB9 → ẹ<br class="autobr" /> →Latin Small Letter E With Dot Below<br class="autobr" /> →UTF-8 (Hex) : E1BAB9<br class="autobr" /> →Unicode (Hex) : 01EB9<br class="autobr" /> 11100001 10111010 10111001 donne ẹ et non ?</p> <p>Par contre il existe un caractère unicode qui ressemble à ? mais n'est pas ?<br class="autobr" /> c'est le caractère suivant ?<br class="autobr" /> et voiçi ses caractéristiuqes<br class="autobr" /> 11101111 10111100 10011111→EFBC9F→?<br class="autobr" /> ?Fullwidth Question Mark<br class="autobr" /> Unicode (Hex) : 0FF1F<br class="autobr" /> UTF-8 (Hex) : EFBC9F</p> <p>il est différend de ?<br class="autobr" /> Question Mark<br class="autobr" /> Unicode (Hex) : 0003F<br class="autobr" /> UTF-8 (Hex) : 3F</p> <p>D'ailleurs ?peut être utilisé dans les noms de fichiers mais pas ? <br class="autobr" /> Et aussi :peut être utilisé dans les noms de fichiers mais pas :<br class="autobr" /> de quoi rendre fou ceux et celles qui ne connaissent pas ces caractères unicodes :-)</p> <p>Fullwidth Colon :<br class="autobr" /> Unicode (Hex) : 0FF1A<br class="autobr" /> UTF-8 (Hex) : EFBC9A<br class="autobr" /> Colon :<br class="autobr" /> Unicode (Hex) : 0003A<br class="autobr" /> UTF-8 (Hex) : 3A</p> Introduction aux jeux de caractères 2015-01-05T02:06:34Z https://openweb.eu.org/articles/jeux_caracteres#comment2636 2015-01-05T02:06:34Z <p>?<br class="autobr" /> :?: ils sont différends de<br class="autobr" /> ?</p> <p>ISO-8859-1 11101001 E9 → <br class="autobr" /> UTF-8 11000011 10101001 C3 A9<br class="autobr" /> Ã</p> Introduction aux jeux de caractères 2014-02-27T11:03:10Z https://openweb.eu.org/articles/jeux_caracteres#comment2222 2014-02-27T11:03:10Z <p>Miam Miam votre commentaire Philippe. Merci !</p> <p>OpenWeb serait une très bonne tribune pour recueillir vos propos.</p> Introduction aux jeux de caractères 2012-09-29T21:58:00Z https://openweb.eu.org/articles/jeux_caracteres#comment1000 2012-09-29T21:58:00Z <p>J'ai toujours eu de la difficulté avec l'encoding. Alors j'avais décidé de ne pas mourir idiot. J'ai donc fait un peu de recherche et je suis tombé sur cet article. Merci pour sa clarté ! C'est rare que nos jours ! <br class="autobr" /> Je ne comprends pas pourquoi, cependant, vous dites que le point d'interrogation n'existe pas dans la jeu ISO-8859-1 ?<br class="autobr" /> Peut-être est-ce une erreur typographique dans votre article.</p> <p>En tous cas merci.<br class="autobr" /> (et pour ce qui est du code morse, je le connait déjà, merci d'avoir fait l'impasse ;-)</p> Introduction aux jeux de caractères 2011-05-03T02:11:07Z https://openweb.eu.org/articles/jeux_caracteres#comment456 2011-05-03T02:11:07Z <p>Bonjour,<br class="autobr" /> Juste un petit mot pour tous vous remercier !<br class="autobr" /> J'ai des probleme d'encodage entre le php et le javascript et ma base de donnee, et grace a ce texte je comprend mieux la profondeur de la chose.</p> <p>Merci encore !!</p> Introduction aux jeux de caractères 2011-03-20T09:53:05Z https://openweb.eu.org/articles/jeux_caracteres#comment428 2011-03-20T09:53:05Z <p>@Philippe Superbe ! Merci pour le cours...<br class="autobr" /> Merci à toi aussi Steve, très instructif tout ça. Je me permet de donner une référence supplémentaire <a href="http://www.cs.tut.fi/~jkorpela/chars.html" class="spip_url spip_out auto" rel="nofollow external">http://www.cs.tut.fi/~jkorpela/chars.html</a><br class="autobr" /> ++</p> Introduction aux jeux de caractères 2011-02-20T12:34:14Z https://openweb.eu.org/articles/jeux_caracteres#comment409 2011-02-20T12:34:14Z <p>C'est très intéressant, cela mériterait quelques pages.<br class="autobr" /> Merci beaucoup.</p> Introduction aux jeux de caractères 2010-09-23T11:47:01Z https://openweb.eu.org/articles/jeux_caracteres#comment316 2010-09-23T11:47:01Z <p>Approfondissez, approfondissez !! Et merci pour la leçon d'histoire. Il est toujours intéressant de pouvoir considérer dans un contexte historique les "technologies" actuelles.</p> <p>Hubert.</p> Introduction aux jeux de caractères 2010-08-15T17:30:04Z https://openweb.eu.org/articles/jeux_caracteres#comment285 2010-08-15T17:30:04Z <p>Bonjour,<br class="autobr" /> Dans votre article vous tentez une approche historique des codages des caractères et vous annoncez que l'ancêtre est l'ASCII sur 7 bits plus parité. Vous ignorez toute une partie de l'histoire qui commence avant l'ère informatique.</p> <p>Avant que l'homme ne sache réaliser une machine répondant aux études de Pascal et Leibnitz, la notion de codage était déjà connue. La découverte faite par l'homme et par accident par Volta de l'énergie électrique est aussi arrivée bien avant les "calculateurs" et très rapidement aux Etats Unis, les scientifiques ont mélangé le codage et l'électricité : ils venaient de découvrir "Le fil qui chante", autrement mieux connu sous le terme de télégraphe.</p> <p>Au début il ont utilisé le code morse qui était décodé directement par un opérateur instruit. Ce code ne connaissait que les lettres, les chiffres et quelques signes de ponctuation.</p> <p>L'introduction du ruban papier se fait dès le début du 20ième siècle, il permet toutes sortes de transmissions rapides avec les lecteurs motorisés connectés sur des machines à écrire. On en voit un exemple dans le film l'Arnaque, où le bureau du bookmaker de Chicago reçoit en direct par Telex les résultats des courses. C'est là que nous trouvons un constructeur de machines à écrire, International Business ... , (hé oui) en Europe Olivetti, LogAbax et bien d'autres construisaient aussi des machines de bureau, leurs évolutions vers le calcul électronique est une suite logique.</p> <p>Les dispositifs de transmission électromécaniques n'avaient pas une grande bande passante et le code du télégraphe fut adapté pour qu'il devienne facilement transportable sur le "fil qui chante" sans reconstruire un nouveau réseau. La aussi je m'ose un autre parallèle, les chercheurs qui ont développé l'ADSL, s'étaient imposé le support physique (couche 1) existant comme contrainte, la raison économique est assez évidente. Ils devaient coder 26 lettres 10 chiffres et quelques symboles de ponctuation, ils ont utilisé un codage sur 5 bits plus parité.<br class="autobr" /> Ils utilisaient la position haute et la position basse de la machine à écrire, une touche permettant de faire glisser dans son bâti toute la mécanique d'impression, les bras qui frappaient sur le papier pouvaient ainsi imprimer chacun deux caractères. Le codage sur 5 bits offrait 30 caractères par positionnement, les caractères de positionnement étant commun aux deux.<br class="autobr" /> Et comment dit-on glisser en anglais ? " shift ".<br class="autobr" /> Notre touche shift doit son nom au télex qui fut le premier système de transmission électronique standardisé mondialement. Le télex est mort dans la seconde moitié du XX ième siècle, à cette époque les équipements d'extrémité étaient quasiment tous construits par le constructeur : Teletype. C'est l'abbréviation de son nom qui devint le nom de code des premiers terminaux asynchrone d'Unix dans les années 70 : TTY. <br class="autobr" /> Ce code à 5 bits + parité était encore utilisé par les ordinateurs ITT 3200, à la fin des années 70, qui pilotaient les centraux Metaconta qui furent commandés par la DGT et Norbert Segard quand la France se fut décidée à moderniser son réseau téléphonique.<br class="autobr" /> Ce code est encore connu sous le nom d'Alphabet CCITT numéro 3.</p> <p>Le CCITT N3 était très pauvre, l'apparition des modems et de l'informatique a permis d'envisager des débits bien supérieurs à ceux du télex, dès lors qu'il n'y avait plus de système à moteur électrique tournant pour encoder les caractères sur la ligne de transmission. On put ainsi élargir les caractères et passer à 7 bits + parité. L'alphabet CCITT N.5 était né ; il permettait, enfin, une représentation presque correcte des différentes langues simples, l'anglais tient complètement dans ce codage. Par contre pour les français on pouvait disposer des minuscules accentuées et des signes diacritiques au prix de la perte de certains caractères spéciaux comme les parenthèses, accolades et certains symboles monétaires.<br class="autobr" /> La programmation en C nécessitait de changer de page de code.<br class="autobr" /> C'est seulement à partir d'ici que l'on reprend votre article.</p> <p>Désolé d'avoir été long, mais j'ai débuté en 1973 et suis toujours en activité, j'ai participé à toute l'évolution du télex et de la téléphonie, à la téléinformatique, puis à x25 et à la télématique pour se terminer avec TCP/IP et les réseaux à très haut débit.</p> <p>Si ce papier vous intéresse, je peux le réécrire en l'approfondissant afin que toute cette préhistoire soit bien expliquée et que l'on puisse voir dans les technologies actuelles les restes des balbutiements.</p> <p>Philippe Durand</p>