Disponible en avril 2002, le 5.000e texte est The Notebooks of Leonardo da Vinci (Les Carnets de Léonard de Vinci), qui datent du début du 16e siècle. Un texte qui, en 2008, se trouve toujours dans le «Top 100» des livres téléchargés.

En 1988, Michael Hart choisit de numériser Alice’s Adventures in Wonderland et Peter Pan parce que, dans l’un et l’autre cas, leur version numérisée tient sur la disquette standard de l’époque de 360 Ko (kilo-octets). Quinze ans plus tard, en 2002, on dispose de disquettes de 1,44 Mo (mégaoctets) et on peut aisément compresser les fichiers en les zippant. Un fichier standard peut désormais comporter trois millions de caractères, plus qu’il n’en faut pour un livre de taille moyenne. Un roman de 300 pages numérisé au format ASCII représente un mégaoctet. Un livre volumineux représente deux fichiers ASCII, téléchargeables tels quels ou en version zippée.

Cinquante heures environ sont nécessaires pour sélectionner un livre de taille moyenne, vérifier qu’il est bien du domaine public, le scanner, le corriger, le formater et le mettre en page.

Quelques numéros de livres sont réservés pour l’avenir, par exemple le numéro 1984 (eBook #1984) pour le roman éponyme de George Orwell, publié en 1949, et qui est donc loin d’être tombé dans le domaine public.

En 2002, les collections s’accroissent de 203 titres par mois. Au printemps 2002, elles représentent le quart des oeuvres du domaine public en accès libre sur le web, recensées de manière pratiquement exhaustive par l’Internet Public Library (IPL). Un beau résultat dû au patient travail de milliers de volontaires actifs dans plusieurs pays.

1.000 livres en août 1997, 2.000 livres en mai 1999, 3.000 livres en décembre 2000, 4.000 livres en octobre 2001, 5.000 livres en avril 2002, 10.000 livres en octobre 2003. Le 10.000e livre est The Magna Carta, qui fut le premier texte constitutionnel anglais, signé au début du 13e siècle.

Entre avril 2002 et octobre 2003, les collections doublent, passant de 5.000 à 10.000 livres en dix-huit mois. La moyenne mensuelle est de 348 livres numérisés en 2003.

Un CD «Best of Gutenberg» est disponible en août 2003 avec une sélection de 600 livres. En décembre 2003, date à laquelle le Projet Gutenberg franchit la barre des 10.000 livres, la quasi-totalité des livres (9.400 livres) est gravée sur un DVD. CD et DVD sont envoyés gratuitement à qui en fait la demande. Libre ensuite à chacun de faire autant de copies que possible et de les distribuer autour de soi.

Dix mille livres. Un chiffre impressionnant quand on pense à ce que cela représente de pages scannées, relues et corrigées. Cette croissance rapide est due à l’activité de Distributed Proofreaders (DP), un site conçu en 2000 par Charles Franks pour permettre la correction partagée. Les volontaires choisissent un livre en cours de traitement pour relire et corriger une page donnée. Chacun travaille à son propre rythme. A titre indicatif, le site conseille de relire une page par jour. C’est peu de temps sur une journée, et c’est beaucoup pour le projet.

= De dix mille à vingt mille livres