En janvier 2004, le Projet Gutenberg essaime outre-Atlantique avec la création du Projet Gutenberg Europe. A la mission originelle s’ajoute le rôle de passerelle entre les langues et les cultures, l’objectif étant une bibliothèque d’un million de livres d’ici 2015, avec de nombreuses sections nationales et linguistiques. Tout en conservant la même ligne de conduite, à savoir la lecture pour tous à moindres frais, par le biais du texte électronique gratuit, indéfiniment utilisable et reproductible. Et, dans un deuxième temps, la numérisation de l’image et du son, dans le même esprit.

= Gestation puis persévérance

Revenons aux tous débuts du projet. Alors étudiant à l’Université d’Illinois (Etats-Unis), Michael Hart se voit attribuer 100 millions de dollars de «temps machine» par le laboratoire informatique (Materials Research Lab) de son université. Le 4 juillet 1971, jour de la fête nationale, il saisit The United States Declaration of Independence (Déclaration de l’indépendance des Etats-Unis, signée le 4 juillet 1776) sur le clavier de son ordinateur. En caractères majuscules, puisque les caractères minuscules n’existent pas encore. Le texte électronique représente 5 Ko (kilo-octets). Mais l’envoi d’un fichier de 5 Ko à la centaine de personnes que représente le réseau de l’époque aurait fait imploser celui-ci, la bande passante étant infime. Michael Hart diffuse donc un message indiquant où le texte est stocké (sans lien hypertexte toutefois, puisque le web ne voit le jour que vingt ans après), suite à quoi le fichier est téléchargé par six personnes. Le Projet Gutenberg est né.

Dans la foulée, Michael Hart décide de consacrer ce crédit-temps de 100 millions de dollars à la recherche des oeuvres du domaine public disponibles en bibliothèque et à la numérisation de celles-ci. Il décide aussi de stocker les textes électroniques de la manière la plus simple possible, au format ASCII, pour que ces textes puissent être lus sans problème quels que soient la machine, la plateforme et le logiciel utilisés. Au lieu d’un ensemble de pages reliées, le livre devient un texte électronique que l’on peut dérouler en continu, avec des lettres capitales pour les termes en italique, en gras et soulignés de la version imprimée.

Peu après, il définit la mission du Projet Gutenberg: mettre à la disposition de tous, par voie électronique, le plus grand nombre possible d’oeuvres du domaine public. «Nous considérons le texte électronique comme un nouveau médium, sans véritable relation avec le papier», explique-t-il beaucoup plus tard, en août 1998. «Le seul point commun est que nous diffusons les mêmes oeuvres, mais je ne vois pas comment le papier peut concurrencer le texte électronique une fois que les gens y sont habitués, particulièrement dans les écoles.»

Après avoir saisi The United States Declaration of Independence en 1971, Michael Hart poursuit ses efforts en 1972 en saisissant un texte plus long, The United States Bill of Rights (Déclaration des droits américaine). Cette Déclaration des droits comprend les dix premiers amendements ajoutés en 1789 à la Constitution des Etats-Unis (qui date elle-même de 1787), et définissant les droits individuels des citoyens et les pouvoirs respectifs du gouvernement fédéral et des Etats. En 1973, Michael Hart saisit The United States Constitution (Constitution des Etats-Unis) dans son entier.

D’année en année, la capacité de la disquette augmente régulièrement (le disque dur n’existe pas encore), si bien qu'il est possible d’envisager des fichiers de plus en plus volumineux. Michael Hart entreprend la numérisation de la Bible, composée elle-même de plusieurs «livres», qui peuvent être traités séparément et occuper chacun un fichier différent. Il débute aussi la saisie des oeuvres complètes de Shakespeare, une pièce après l’autre, avec un fichier pour chaque pièce. Cette édition n'est d’ailleurs jamais mise en ligne, du fait d’une loi plus contraignante sur le copyright entrée en vigueur dans l’intervalle, et qui vise non pas le texte de Shakespeare, tombé depuis longtemps dans le domaine public, mais les commentaires et notes de cette édition. D’autres éditions annotées appartenant au domaine public sont mises en ligne quelques années après.

Parallèlement, l’internet, qui était encore embryonnaire en 1971, débute véritablement en 1974, suite à la création du protocole TCP/IP (transmission control protocol / internet protocol). En 1983, le réseau est en plein essor.

= De dix à mille livres

En août 1989, le Projet Gutenberg met en ligne son dixième texte, The King James Bible. En 1990, les internautes sont au nombre de 250.000, et le standard en vigueur est la disquette de 360 Ko (kilo-octets). En janvier 1991, Michael Hart saisit Alice’s Adventures in Wonderland (Alice au pays des merveilles) de Lewis Carroll (paru en 1865). En juillet de la même année, il saisit Peter Pan de James M. Barrie (paru en 1904). Ces deux classiques de la littérature enfantine tiennent chacun sur une disquette standard.