Projet pionnier à tous égards, le Projet Gutenberg a inspiré bien d’autres bibliothèques numériques depuis. Fondé dès 1971 par Michael Hart, alors étudiant à l’Université de l’Illinois (Etats-Unis), le Projet Gutenberg se donne pour mission de mettre gratuitement le plus grand nombre possible de textes électroniques à la disposition du plus grand nombre possible de lecteurs. A l’automne 1998, le rythme de publication est de 45 nouveaux titres par mois, avec l’aide de nombreux volontaires.
Comme expliqué par son créateur dans History and Philosophy of Project Gutenberg, le projet débute en 1971 quand le centre informatique (Materials Research Lab) de son université lui attribue un compte de 100 millions de dollars de "temps machine". Michael Hart décide de consacrer cet impressionnant crédit au stockage d’oeuvres littéraires du domaine public. Il décide aussi de stocker les textes électroniques de la manière la plus simple possible, en utilisant le format ASCII (American standard code for information interchange), afin que ces textes puissent être lus quels que soient la machine et le logiciel utilisés. Un texte au format ASCII apparaît en continu, sans paramétrage, avec des lettres capitales pour les titres et pour les termes en italique, gras et soulignés de la version d’origine. Cinquante heures environ sont nécessaires pour sélectionner, scanner, dactylographier, corriger et mettre en page une œuvre électronique. Un ouvrage de taille moyenne (par exemple un roman de Stendhal ou de Jules Verne) représente deux fichiers ASCII.
Le Projet Gutenberg propose trois grands secteurs: la littérature de divertissement (Light Literature), comme Alice au pays des merveilles, Peter Pan ou les Fables d’Esope, la littérature "sérieuse" (Heavy Literature) comme La Bible, les oeuvres de Shakespeare ou Moby Dick, et enfin la littérature de référence (Reference Literature), qui regroupe les encyclopédies et les dictionnaires, par exemple le Thesaurus de Roget.
La vocation du Projet Gutenberg est universelle. Son but est de mettre la littérature à la disposition de tout le monde, et pas seulement des étudiants, professeurs et chercheurs. Le secteur consacré à la littérature de divertissement est destiné à amener devant l’écran aussi bien un enfant d’âge pré-scolaire qu’une personne du troisième âge. Des enfants ou des grand-parents recherchent le texte électronique de Peter Pan après avoir vu le film Hook au cinéma, ou bien ils lisent Alice au pays des merveilles après avoir regardé le film à la télévision. Pratiquement tous les épisodes de Star Trek mentionnent des sources existant dans les collections du Projet Gutenberg. L’objectif est que tous les publics, qu’ils soient familiers ou non avec le livre imprimé, puissent facilement retrouver des citations entendues dans des conversations, des films, des musiques, d’autres livres, etc.
En juillet 1997, le Projet Gutenberg fête son 26e anniversaire avec la mise en ligne des Merry Adventures of Robin Hood de Howard Pyle. En septembre 1997, il fête son millième texte électronique avec la version anglaise de la Divine Comédie de Dante. Dans sa lettre d’information d’octobre 1997, Michael Hart annonce son intention de compléter la collection d’Oscar Wilde, de séparer les fichiers des oeuvres complètes de Shakespeare en fichiers individuels pour chaque oeuvre, et de mettre en ligne davantage de livres non anglophones.
Le catalogue comporte déjà quelques titres non anglophones (allemand, espagnol, français, italien et latin), mais ils ne sont pas légion. A titre anecdotique, une recherche lancée en janvier 1998 pour trouver des livres en français donne neuf titres: six romans de Stendhal (L’Abbesse de Castro, La Chartreuse de Parme, La Duchesse de Palliano, Le Rouge et le Noir, Les Cenci, Vittoria Accorambani), deux romans de Jules Verne (De la terre à la lune et Le tour du monde en 80 jours) et French Cave Paintings (titre anglais et texte français), un ouvrage sur les peintures préhistoriques. A part ce dernier titre, mis en ligne en 1995, tous ces livres sont intégrés à la bibliothèque début 1997. Si aucun titre de Stendhal n'est disponible en anglais, il existe trois oeuvres de Jules Verne en langue anglaise : From the Earth to the Moon (mis en ligne en septembre 1993), Around the World in 80 Days (mis en ligne en janvier 1994) et 20,000 Leagues Under the Sea (mis en ligne en septembre 1994). En septembre 1998, la même requête donne deux titres supplémentaires, Cyrano de Bergerac, d’Edmond Rostand (mis en ligne en mars 1998), et La Révolution française, de Thomas Carlyle (mis en ligne en mai 1998).
Interviewé en août 1998, Michael Hart précise: "Nous considérons le texte électronique comme un nouveau médium, sans véritable relation avec le papier. Le seul point commun est que nous diffusons les mêmes oeuvres, mais je ne vois pas comment le papier peut concurrencer le texte électronique une fois que les gens y sont habitués, particulièrement dans les établissements d’enseignement. (…) Mon projet est de mettre 10.000 textes électroniques sur l'internet. Si je pouvais avoir des subventions importantes, j’aimerais aller jusqu’à un million et étendre aussi le nombre de nos usagers potentiels de 1,x% à 10% de la population mondiale, ce qui représenterait la diffusion de 1.000 fois un milliard de textes électroniques au lieu d'un milliard seulement." Michael Hart se définit lui-même comme un fou de travail dédiant toute sa vie à son projet, qu’il voit comme étant à l’origine d’une révolution néo-industrielle. (En avril 2002, le Projet Gutenberg fête son 5.000e texte. En octobre 2003, le catalogue comprend 10.000 oeuvres dans plusieurs langues. Michael Hart espère franchir la barre du million de livres d'ici 2015.)
7.2. Bibliothèques numériques francophones
= ABU: la bibliothèque universelle
Fondée en avril 1993 par l’Association des bibliophiles universels (ABU) dans la lignée du Projet Gutenberg, l’ABU: la bibliothèque universelle est hébergée par le Centre d’études et de recherche informatique (CEDRIC) du Conservatoire des arts et métiers (CNAM) de Paris. Elle est la première bibliothèque numérique francophone du réseau. Fin 1998, ses collections comprennent 223 textes et 76 auteurs.