En 2002, les collections s’accroissent de 203 titres par mois. Au printemps 2002, elles représentent le quart des oeuvres du domaine public en accès libre sur le web, recensées de manière pratiquement exhaustive par l’Internet Public Library (IPL), un beau résultat dû au patient travail de milliers de volontaires actifs dans de nombreux pays.

1.000 livres en août 1997, 2.000 livres en mai 1999, 3.000 livres en décembre 2000, 4.000 livres en octobre 2001, 5.000 livres en avril 2002, 10.000 livres en octobre 2003. Le 10.000e livre est The Magna Carta, qui fut le premier texte constitutionnel anglais, signé en 1215.

Entre avril 2002 et octobre 2003, les collections doublent, passant de 5.000 à 10.000 livres en dix-huit mois. La moyenne mensuelle est de 348 livres numérisés en 2003.

Dix mille livres. Un chiffre impressionnant quand on pense à ce que cela représente de pages scannées, relues et corrigées. Cette croissance rapide est due à l’activité de Distributed Proofreaders (DP), un site conçu en 2000 par Charles Franks pour permettre la correction partagée des livres entre de nombreux volontaires. Les volontaires choisissent un livre en cours de traitement pour relire et corriger une page donnée. Chacun travaille à son propre rythme. A titre indicatif, il est conseillé de relire une page par jour. C’est peu de temps sur une journée, et c’est beaucoup pour le projet.

En août 2003, un CD-ROM Best of Gutenberg est disponible avec une sélection de 600 livres. En décembre 2003, date à laquelle le Projet Gutenberg franchit la barre des 10.000 livres, la quasi-totalité des livres (9.400 livres) est gravée sur un DVD. CD-ROM et DVD sont envoyés gratuitement à qui en fait la demande. Libre ensuite à chacun de faire autant de copies que possible et de les distribuer autour de soi.

# De 10.000 à 20.000 ebooks

En décembre 2003, les collections approchent les 11.000 livres. Plusieurs formats sont désormais présents, par exemple les formats HTML, XML et RTF, le format principal - et obligatoire – restant l’ASCII. Le tout représente 46.000 fichiers, soit une capacité totale de 110 Go (giga-octets).

Le 13 février 2004, date de la conférence de Michael Hart au siège de l’UNESCO à Paris, les collections comprennent très exactement 11.340 livres dans 25 langues. En mai 2004, les 12.500 livres disponibles représentent 100.000 fichiers dans vingt formats différents, soit une capacité totale de 135 Go, destinée à doubler chaque année avec l’ajout d'environ 300 livres par mois (338 livres en 2004).

Parallèlement, le Project Gutenberg Consortia Center (PGCC), qui avait été lancé en 1997 pour rassembler des collections de livres numériques déjà existantes et provenant de sources extérieures, est officiellement affilié au Projet Gutenberg en 2003.

Par ailleurs, le Projet Gutenberg Europe est lancé à l’instigation du Projet Rastko, basé à Belgrade, en Serbie. Distributed Proofreaders Europe débute ses activités en janvier 2004, avec cent livres disponibles en avril 2005. Les livres sont en plusieurs langues pour refléter la diversité linguistique prévalant en Europe, avec cent langues prévues sur le long terme.