Avec le développement du web, l’échange des données s’internationalise de plus en plus. On ne peut plus se limiter à l’utilisation de l’anglais et de quelques langues européennes, traduites par un système d’encodage datant des années 1960. Publié pour la première fois en janvier 1991, l’Unicode est un système d'encodage universel sur 16 bits spécifiant un nombre unique pour chaque caractère. Ce nombre est lisible quels que soient la plateforme, le logiciel et la langue utilisés. L’Unicode peut traiter 65.000 caractères uniques et prendre en compte tous les systèmes d’écriture de la planète.

L'ASCII garde toutefois une place prépondérante. Dénommé à juste titre le plus petit dénominateur commun, l’ASCII sur sept bits est le seul format compatible avec 99% des machines et des logiciels, et pouvant être converti dans d’autres formats. Il sera toujours utilisé quand d’autres formats auront disparu, à commencer par les formats éphémères liés à quelques tablettes de lecture commercialisées depuis 1999 et déjà disparues du marché. Il est l’assurance que les documents survivront aux changements technologiques des prochaines décennies ou même des prochains siècles. Il n’existe pas d’autre standard aussi largement utilisé, y compris l’Unicode, ce jusqu'en 2008, date à laquelle les deux systèmes d'encodage sont également représentés sur le web.

1971: PROJET GUTENBERG

[Résumé]

Fondé par Michael Hart en juillet 1971 alors qu’il était étudiant à l’Université d’Illinois (Etats-Unis), le Projet Gutenberg a pour but de diffuser gratuitement par voie électronique le plus grand nombre possible d’oeuvres du domaine public. Il est le premier site d’information sur un internet encore embryonnaire, qui débute véritablement en 1974 et prend son essor en 1983. Vient ensuite le web (sous-ensemble de l’internet), opérationnel en 1991, puis le premier navigateur, qui apparaît en novembre 1993. Lorsque l’utilisation du web se généralise, le Projet Gutenberg trouve un second souffle et un rayonnement international. Au fil des ans, des centaines d’oeuvres sont patiemment numérisées en mode texte par des milliers de volontaires. D’abord essentiellement anglophones, les collections deviennent peu à peu multilingues. Le Projet Gutenberg Europe débute en janvier 2004. Le Projet Gutenberg franchit la barre des 20.000 titres en décembre 2006 et celle des 25.000 titres en avril 2008.

[En détail]

Si le livre imprimé a cinq siècles et demi, le livre numérique n'a pas encore 40 ans. Il est né avec le Projet Gutenberg, créé en juillet 1971 par Michael Hart pour diffuser gratuitement sous forme électronique les oeuvres littéraires du domaine public. Site pionnier à tous égards, le Projet Gutenberg est à la fois le premier site d’information sur un réseau encore embryonnaire et la première bibliothèque numérique. Longtemps considéré par ses détracteurs comme totalement irréaliste, le Projet Gutenberg compte 30.00 titres en novembre 2008, avec des dizaines de milliers de téléchargements quotidiens. A ce jour, personne n’a fait mieux pour mettre les classiques de la littérature mondiale à la disposition de tous, ni pour créer à moindres frais un immense réseau de volontaires de par le monde, sans gâchis de compétences ni d’énergie.

Les vingt premières années, Michael Hart numérise lui-même les cent premiers livres, avec l’aide occasionnelle de telle ou telle personne. Lorsque l’utilisation du web se généralise au milieu des années 1990, le projet trouve un second souffle et un rayonnement international. Tout en continuant de numériser des livres, Michael coordonne désormais le travail de dizaines puis de centaines de volontaires de par le monde. Les collections atteignent 1.000 livres en août 1997, 2.000 livres en mai 1999, 3.000 livres en décembre 2000 et 4.000 livres en octobre 2001.

Trente ans après ses débuts, le Projet Gutenberg fonctionne à plein régime. La barre des 5.000 livres est franchie en avril 2002, celle des 10.000 livres en octobre 2003, celle des 15.000 livres en janvier 2005, celle des 20.000 livres en décembre 2006 et celle des 25.000 livres en avril 2008, avec 340 nouveaux livres par mois, 40 sites miroirs dans de nombreux pays, plusieurs dizaines de milliers de téléchargements par jour et des dizaines de milliers de volontaires toutes équipes confondues.

Qu’ils aient été numérisés il y a trente ans ou qu’ils soient numérisés maintenant, tous les livres sont numérisés en mode texte, en utilisant l’ASCII (American standard code for information interchange) original sur sept bits, avec des règles précises pour le formatage. Grâce à quoi les textes peuvent être lus sans problème quels que soient la machine, la plateforme et le logiciel utilisés, y compris sur un PDA ou sur une tablette de lecture. Libre ensuite à chacun de convertir les livres dans d'autres formats, après avoir vérifié que les oeuvres sont également du domaine public dans le pays concerné.