Disponible en abril de 2002, el 5.000° texto es "The Notebooks of Leonardo da Vinci" (Los cuadernos de Leonardo da Vinci), que datan de inicios de siglo XVI. En 2008, este texto aún se encuentra en el Top 100 de los libros descargados con más frecuencia.
En 1988, Michael Hart decidió digitalizar "Alice’s Adventures in Wonderland" (Las aventuras de Alicia en el país de las maravillas) o "Peter Pan" porque su versión digital cupo en un disquete de 360 Ko, o sea el estándar de la época. Quince años más tarde, en 2002, ya disponemos de disquetes de 1,44 M (megabytes) y resulta muy sencillo comprimir archivos en archivos ZIP. Un archivo estándar puede contener tres millones de caracteres, o sea más de los necesarios para un libro de tamaño mediano, ya que una novela de 300 páginas digitalizada en formato ASCII representa 1 M (megabyte). Un libro voluminoso cabe en dos archivos ASCII, descargables en versión normal o en versión comprimida. Se necesitan unas cincuenta horas para seleccionar un libro de tamaño mediano, comprobar que ha pasado al dominio público, escanearlo, corregirlo, formatearlo y compaginarlo.
Algunos números de libros se reservan para más tarde, por ejemplo el número 1984 (eBook #1984) para la novela epónima de George Orwell, publicada en 1949, que aún está lejos de pasar al dominio público.
En 2002, las colecciones se amplían de 203 títulos al mes. Al llegar la primavera de 2002, ya cubren un cuarto de las obras del dominio público de libre acceso en la web, inventariadas de forma casi exhaustiva por la Internet Public Library (IPL). Un buen resultado, fruto del trabajo paciente de miles de voluntarios activos en numerosos países.
1.000 libros en agosto de 1997, 2.000 libros en mayo de 1999, 3.000 libros en diciembre de 2000, 4.000 libros en octubre de 2001, 5.000 libros en abril de 2002, 10.000 libros en octubre de 2003. El 10.000° libro es "The Magna Carta", que fue el primer texto constitucional inglés, firmado en 1215.
Entre abril de 2002 y octubre de 2003, las colecciones se duplican, pasando de 5.000 a 10.000 libros en dieciocho meses. En 2003, se digitalizan de promedio unos 348 libros al mes.
Diez mil libros: una cifra impresionante si uno piensa en lo que aquello representa en términos de páginas escaneadas, releídas y corregidas. Este crecimiento rápido se debe a la actividad de Distributed Proofreaders (DP), un sitio web concebido en 2000 por Charles Franks para repartir la corrección de las obras entre varias personas. Los voluntarios eligen uno de los libros cuya digitalización ya ha empezado para releer y corregir determinada página. Cada cual trabaja a su ritmo. A título indicativo, en el sitio web se aconseja repasar una página al día. Representa poco tiempo en un día, pero mucho para el proyecto.
En agosto de 2003, se pone a disposición un CD "Best of Gutenberg" con una selección de 600 libros. En diciembre de 2003, fecha en la que el Proyecto Gutenberg alcanza la cifra de 10.000 libros, se graba en un DVD la casi totalidad de los libros (9.400 libros). Se envían gratuitamente el CD y el DVD a cualquier persona que lo pida. Luego cada uno queda libre de realizar todas las copias que pueda y de distribuirlas a su alrededor.
# De 10.000 à 20.000 ebooks
En diciembre de 2003, las colecciones rondan los 11.000 libros. Varios formatos están representados (HTML, XML, RTF, etc.) pero el formato principal - y obligatorio - sigue siendo el ASCII. Hay 46.000 archivos en conjunto, lo que equivale a una capacidad total de 110 G (gigabytes). El 13 de febrero de 2004, fecha en la que Michael Hart da una conferencia en la sede de la UNESCO en París, las colecciones abarcan exactamente 11.340 libros en 25 idiomas diferentes. En mayo de 2004, los 12.500 libros disponibles representan 100.000 archivos en veinte formatos diferentes, lo que equivale a una capacidad total de 135 G (gigabytes), y ésta debería duplicarse cada año con la agregación de más de 300 libros al mes (338 libros en 2004).