[En détail]

Avec l'apparition du web en 1990, l’échange des données s’internationalise de plus en plus. On ne peut plus se limiter à l’utilisation de l’anglais et de quelques langues européennes, transcrites en ASCII (American standard code for information interchange), un système d'encodage sur sept bits datant de 1968.

Publié pour la première fois en janvier 1991, l’Unicode est un système d'encodage universel sur 16 bits spécifiant un nombre unique pour chaque caractère. Ce nombre est lisible quels que soient la plateforme, le logiciel et la langue utilisés. L’Unicode peut traiter 65.000 caractères uniques et prendre en compte tous les systèmes d’écriture de la planète. A la grande satisfaction des linguistes, il remplace progressivement l’ASCII. L’Unicode dispose de plusieurs variantes en fonction des besoins, par exemple UTF-8, UTF-16 et UTF-32 (UTF: Unicode transformation format). Il devient une composante des spécifications du W3C (World Wide Web Consortium), l'organisme international chargé du développement du web.

L’utilisation de l’Unicode se généralise en 1998, par exemple pour les fichiers texte sous plateforme Windows (Windows NT, Windows 2000, Windows XP, Windows Vista), qui étaient jusque-là en ASCII. Mais l’Unicode ne peut résoudre tous les problèmes, comme le souligne en juin 2000 Luc Dall’Armellina, co-auteur et webmestre d’oVosite, un espace d’écriture multimédia: "Les systèmes d’exploitation se dotent peu à peu des kits de langues et bientôt peut-être de polices de caractères Unicode à même de représenter toutes les langues du monde; reste que chaque application, du traitement de texte au navigateur web, emboîte ce pas. Les difficultés sont immenses: notre clavier avec ses ± 250 touches avoue ses manques dès lors qu’il faille saisir des Katakana ou Hiragana japonais, pire encore avec la langue chinoise. La grande variété des systèmes d’écritures de par le monde et le nombre de leurs signes font barrage. Mais les écueils culturels ne sont pas moins importants, liés aux codes et modalités de représentation propres à chaque culture ou ethnie."

Que préconise Olivier Gainon, créateur de CyLibris et pionnier de l’édition littéraire en ligne? "Première étape: le respect des particularismes au niveau technique, explique-t-il en décembre 2000. Il faut que le réseau respecte les lettres accentuées, les lettres spécifiques, etc. Je crois très important que les futurs protocoles permettent une transmission parfaite de ces aspects - ce qui n’est pas forcément simple (dans les futures évolutions de l’HTML, ou des protocoles IP, etc.). Donc, il faut que chacun puisse se sentir à l’aise avec l’internet et que ce ne soit pas simplement réservé à des (plus ou moins) anglophones. Il est anormal aujourd’hui que la transmission d’accents puisse poser problème dans les courriers électroniques. La première démarche me semble donc une démarche technique. Si on arrive à faire cela, le reste en découle: la représentation des langues se fera en fonction du nombre de connectés, et il faudra envisager à terme des moteurs de recherche multilingues."

1993: ONLINE BOOKS PAGE

[Résumé]

L'Online Books Page est créée en janvier 1993 par John Mark Ockerbloom pour répertorier les textes électroniques de langue anglaise en accès libre sur le web. A cette date, John Mark Ockerbloom est doctorant à l’Université Carnegie Mellon (à Pittsburgh, dans l'Etat de Pennsylvanie). En 1999, il rejoint l’Université de Pennsylvanie pour travailler à la R&D (recherche et développement) de la bibliothèque numérique. A la même époque, il y transfère l'Online Books Page, tout en gardant la même présentation, très sobre, et il poursuit son travail d’inventaire dans le même esprit. En 2003, ce répertoire fête ses dix ans et recense 20.000 textes électroniques, dont 4.000 textes publiés par des femmes. En 2006, il recense 25.000 textes. En 2008, il recense 30.000 textes, dont 7.000 titres du Projet Gutenberg.

[En détail]

Si certains se donnent pour tâche de numériser des oeuvres, comme le
Projet Gutenberg, d'autres décident de répertorier celles qui sont en
accès libre sur le web, en offrant au lecteur un point d’accès commun.
C’est le cas de John Mark Ockerbloom, doctorant à l’Université Carnegie
Mellon (à Pittsburgh, dans l'Etat de Pennsylvanie), qui crée l’Online
Books Page pour recenser les oeuvres anglophones.