L’objectif est donc que le public, qu’il soit familier ou non avec le livre imprimé, puisse facilement retrouver des textes entendus dans des conversations, des films, des musiques, ou alors lus dans d’autres livres, journaux et magazines. Les fichiers électroniques prennent peu de place grâce à l’utilisation du format ASCII. On peut facilement les télécharger par le biais de la ligne téléphonique. La recherche textuelle est tout aussi simple. Il suffit d’utiliser la fonction «rechercher» présente dans n’importe quel logiciel.
En 1997, la production est toujours de 32 titres par mois. En juin 1997, le Projet Gutenberg met en ligne The Merry Adventures of Robin Hood (Les aventures de Robin des Bois) de Howard Pyle (paru en 1883). En août 1997, il met en ligne son millième texte électronique, La Divina Commedia (La Divine Comédie) de Dante Alighieri (parue en 1321), dans sa langue d’origine, en italien.
En août 1998, Michael Hart écrit: «Mon projet est de mettre 10.000 textes électroniques sur l’internet. [NDLR: Ce sera chose faite en octobre 2003.] Si je pouvais avoir des subventions importantes, j’aimerais aller jusqu’à un million et étendre aussi le nombre de nos usagers potentiels de 1,x% à 10% de la population mondiale, ce qui représenterait la diffusion de 1.000 fois un milliard de textes électroniques, au lieu d’un milliard seulement.»
# De 1.000 à 10.000 ebooks
Entre 1998 et 2000, la moyenne est constante, avec 36 textes par mois.
En mai 1999, les collections comptent 2.000 livres. Le 2.000e titre est
Don Quijote (Don Quichotte) de Cervantès (paru en 1605), dans sa langue
d’origine, en espagnol.
Disponible en décembre 2000, le 3.000e titre est le troisième volume de À l’ombre des jeunes filles en fleurs de Marcel Proust (paru en 1919), dans sa langue d'origine, en français. La moyenne passe à 104 livres par mois en 2001.
Mis en ligne en octobre 2001, le 4.000e titre est The French Immortals Series (Collection de textes d'Immortels français), dans sa traduction anglaise. Publié à Paris en 1905 par la Maison Mazarin, ce livre rassemble plusieurs fictions d’écrivains couronnés par l’Académie française, comme Émile Souvestre, Pierre Loti, Hector Malot, Charles de Bernard, Alphonse Daudet, etc.
Disponible en avril 2002, le 5.000e titre est The Notebooks of Leonardo da Vinci (Les Carnets de Léonard de Vinci), des carnets datant du début du 16e siècle et qui se trouvent toujours dans le Top 100 des livres téléchargés en 2010.
En 1988, Michael Hart avait choisi de numériser Alice’s Adventures in Wonderland et Peter Pan parce que, dans l’un et l’autre cas, leur version numérisée tenait sur une disquette de 360 Ko, le standard de l’époque. Quinze ans plus tard, en 2002, on dispose de disquettes de 1,44 Mo et on peut aisément compresser les fichiers en les zippant. Un fichier standard peut désormais comporter trois millions de caractères, plus qu’il n’en faut pour un livre de taille moyenne, puisqu'un roman de 300 pages numérisé au format ASCII représente un méga-octet. Un livre volumineux tient sur deux fichiers ASCII, téléchargeables tels quels ou en version zippée. Cinquante heures environ sont nécessaires pour sélectionner un livre de taille moyenne, vérifier qu’il est bien du domaine public, le scanner, le corriger, le formater et le mettre en page.
Quelques numéros de livres sont réservés pour l’avenir, par exemple le numéro 1984 (eText #1984) pour le roman éponyme de George Orwell, publié en 1949, et qui est donc loin d’être tombé dans le domaine public.