1971: EL PROYECTO GUTENBERG ES LA PRIMERA BIBLIOTECA DIGITAL
= [Resumen]
Fundado por Michael Hart en julio de 1971 cuando estudiaba en la Universidad de Illinois (Estados Unidos), el Proyecto Gutenberg se propone difundir gratuitamente por vía electrónica el mayor número posible de obras literarias. Michael escribió: "Consideramos el texto electrónico como un nuevo medio de comunicación, sin verdadera relación con el papel. La única semejanza es que distribuimos las mismas obras, pero en cuanto la gente se haya acostumbrado, no veo cómo el papel aún podría competir con el texto electrónico, sobre todo en las escuelas." Al generalizarse el uso de la web en los años 90, el Proyecto Gutenberg cobra nueva vida y alcanza una difusión internacional. A lo largo de los años, miles de voluntarios fueron digitalizando con paciencia cientos de obras en modo texto. Primero las colecciones eran esencialmente anglófonas, pero con el tiempo se fueron haciendo multilingües, con sitios web ubicados en varios países (Estados Unidos, Canadá, Europa y Australia) sin contar los que quedan por crear.
= Una apuesta lanzada hace 38 años
# Gestación
¿Cuáles son las raíces del proyecto? Cuando Michael Hart estudiaba en la Universidad de Illinois, en los Estados Unidos, el laboratorio informático (Materials Research Lab) de su universidad le asignó 100 millones de dólares de tiempo de ordenador. El 4 de julio de 1971, día de la fiesta nacional, Michael digitó en el teclado de su ordenador "The United States Declaration of Independence" (Declaración de independencia de los Estados Unidos, firmada el 4 de julio de 1776), en mayúsculas, pues las letras minúsculas aún no existían. El texto electrónico representaba 5 K (kilobytes).
Pero el envío de un archivo de 5 Ko a las cien personas que formaban la red de la época hubiera acabado con el sistema, provocando la implosión de la red. Por aquel tiempo el ancho de banda aún era ínfimo. Michael difundió un mensaje que explicaba dónde se almacenaba el texto (que no contenía aún ningún hipervínculo, pues habría que esperar unos 20 años más para la web). Poco después, seis personas descargaron este archivo.
Sobre la marcha, Michael decidió dedicar ese crédito de tiempo de unos millones de dólares a la búsqueda de obras del dominio público que estuvieran disponibles en bibliotecas, y a la digitalización de éstas. Optó por almacenar los textos electrónicos bajo la forma más sencilla posible, en formato ASCII, para que esos textos pudieran ser leídos sin problema con cualquier ordenador, plataforma y programa. El conjunto de páginas encuadernadas, forma tradicional del libro, se convierte en un texto electrónico que se puede desplegar de par en par, con letras capitales para los términos escritos en cursiva o en negrita y los términos subrayados en la versión impresa.
Poco después, Michael definió así la misión del Proyecto Gutenberg: poner a disposición de todos, por vía electrónica, el mayor número posible de obras del dominio público: "Nosotros consideramos el texto electrónico como un nuevo medio de comunicación, sin verdadera relación con el papel", explicó más tarde, en agosto de 1998. "La única semejanza es que ambos difundimos las mismas obras, pero en cuanto la gente se haya acostumbrado, no veo cómo el papel aún podría competir con el texto electrónico, sobre todo en las escuelas."
Tras haber digitado "The United States Declaration of Independence" en 1971, Michael prosiguió con sus esfuerzos en 1972 digitando "The United States Bill of Rights" (Declaración de derechos de los Estados Unidos). Esa declaración incluye las diez primeras enmiendas añadidas en 1789 a la Constitución de los Estados Unidos (ratificada en 1787), y define los derechos individuales de los ciudadanos y los poderes respectivos del gobierno federal y de los Estados. En 1973, un voluntario digitó "The United States Constitution" (Constitución de los Estados Unidos) en su totalidad.
# Perseverencia
Año tras año, la capacidad del disquete aumenta con regularidad – el disco duro no existe aún – de modo que los archivos pueden ocupar cada vez más espacio. Algunos voluntarios se animan a digitalizar la Biblia, compuesta de varios libros, cada cual puede tratarse por separado y ocupar un archivo diferente.
Michael también empieza a digitar la obra completa de Shakespeare, con la ayuda de voluntarios, una obra de teatro tras otra, cada una en un archivo. De hecho aquella edición nunca se ha podido poner en línea, debido a que entre tanto, había entrado en vigor una ley de copyright más rigurosa, ya no destinada a proteger el texto de Shakespeare, pasado desde hace tiempo al dominio público, sino los comentarios y notas de aquella edición. Otras ediciones anotadas que sí habían pasado al dominio público se pusieron en línea algunos años más tarde.
Por las mismas fechas, el internet, aún embrionario en 1971, despega verdaderamente en 1974, tras la creación del protocolo TCP/IP (transmission control protocol/internet protocol). En 1983, le red está en plena expansión.
# De 10 a 1.000 ebooks
En agosto de 1989, el Proyecto Gutenberg pone en línea su décimo texto,
"The King James Bible", publicada por primera vez en 1611 y cuya
versión más conocida es la de 1769. El conjunto de los archivos del
Antiguo Testamento y del Nuevo Testamento representa 5 M (megabytes).
En 1990, ya hay 250.000 internautas, y el modelo estándar vigente es el disquete de 360 Ko. En enero de 1991, Michael digita "Alice’s Adventures in Wonderland" (Alicia en el país de las maravillas) de Lewis Carroll (publicado en 1865). En julio del mismo año, digita "Peter Pan" de James M. Barrie (publicado en 1904). Cada uno de estos dos clásicos de la literatura infantil cabe en un disquete estándar.
Luego llega la web, operativa a partir de 1991. El primer navegador, Mosaic, aparece en noviembre de 1993. Al generalizarse el acceso a la red, resulta más fácil hacer circular los textos electrónicos y reclutar voluntarios. El Proyecto Gutenberg perfecciona su método de trabajo, y logra digitalizar un texto al mes en 1991, dos textos al mes en 1992, cuatro textos al mes en 1993 y ocho textos al mes en 1994. En enero de 1994, el Proyecto Gutenberg celebra su centésimo libro con la puesta en línea de "The Complete Works of William Shakespeare" (La obra completa de William Shakespeare). Shakespeare escribió la mayor parte de su obra entre 1590 y 1613. A continuación la producción sigue aumentando, con una media de 8 textos al mes en 1994, 16 textos al mes en 1995 y 32 textos al mes en 1996.
Como lo podemos observar, entre 1991 y 1996, las producciones se han duplicado cada año. Mientras sigue con la digitalización de los libros, Michael coordina también a partir de entonces el trabajo de decenas de voluntarios. A partir de finales de 1993, el Proyecto Gutenberg se articula en torno a tres grandes sectores: (a) "Light Literature" (literatura de entretenimiento), que incluye por ejemplo "Alice’s Adventures in Wonderland" (Las aventuras de Alicia en el país de las maravillas), "Peter Pan" o "Aesop’s Fables" (Las Fábulas de Esopo); (b) "Heavy Literature" (literatura "seria"), que incluye por ejemplo La Biblia, las obras de Shakespeare o "Moby Dick"; (c) "Reference Literature" (literatura de referencia), que reúne enciclopedias y diccionarios, por ejemplo el "Roget’s Thesaurus". Más adelante, esta presentación en tres sectores es sustituida por una clasificación detallada con más secciones.
El Proyecto Gutenberg pretende ser universal, tanto a nivel de las obras que selecciona como del público al que se dirige, ya que la meta es poner la literatura a disposición de todos, sin limitarse al público habitual de estudiantes y docentes.
El sector dedicado a la literatura de entretenimiento se propone atraer frente a la pantalla a un público muy diverso, por ejemplo a niños y a sus abuelos en busca del texto electrónico de "Peter Pan" después de haber visto la película Hook, de la versión electrónica de "Alicia en el país de las maravillas" tras haber visto una adaptación televisiva, o del origen de una cita literaria tras visionar un episodio de Star Trek. En casi todos los episodios de Star Trek se citan libros disponibles en versión digital en el Proyecto Gutenberg.
El objetivo, entonces, es que el público, esté o no esté acostumbrado al contacto con el libro impreso, pueda encontrar con facilidad los textos escuchados en conversaciones, películas, músicas, o leídos en otros libros, periódicos y revistas. Gracias al uso del formato ASCII, los archivos electrónicos no ocupan mucho espacio. Se pueden descargar fácilmente a través de la línea telefónica. La búsqueda textual es igual de sencilla. Basta con utilizar la función "buscar" presente en cualquier programa.
En 1997, la producción sigue siendo de 32 títulos al mes. En junio de 1997, el Proyecto Gutenberg pone en línea "The Merry Adventures of Robin Hood" (Las alegres aventuras de Robin Hood) de Howard Pyle (publicado en 1883). En agosto de 1997, pone en línea su milésimo texto electrónico, "La Divina Commedia" (La Divina Comedia) de Dante Alighieri (publicada en 1321), en su idioma original, el italiano.
Michael Hart escribió en agosto de 1998: "Mi proyecto es cargar 10.000 textos electrónicos en el internet. Si pudiera conseguir subvenciones más importantes, me gustaría llegar hasta un millón y ampliar también el número de nuestros usuarios potenciales pasando de un 1,x% a un 10% de la población mundial, lo que representaría la distribución de 1.000 veces un billón de textos electrónicos en lugar de un solo billón."
# De 1.000 a 10.000 ebooks
Entre 1998 y 2000, la media sigue constante, con 36 textos al mes. En mayo de 1999, las colecciones cuentan con 2.000 libros. El 2000º texto es "Don Quijote" (publicado en 1605), en castellano.
Disponible en diciembre del año 2000, el 3.000° título es el tercer volumen de "A l'ombre des jeunes filles en fleur (A la sombra de las muchachas en flor) de Marcel Proust (publicado en 1919), en su idioma original, en francés. La media pasa a 104 libros al mes en 2001.
Puesto en línea en octubre de 2001, el 4.000° texto es "The French Immortals Series" (Obras de los Inmortales franceses), en versión inglesa. Publicado en 1905 por la Maison Mazarin (París), este libro reúne varias ficciones de escritores laureados por la Academia de la lengua francesa (Académie française), como Emile Souvestre, Pierre Loti, Hector Malot, Charles de Bernard, Alphonse Daudet y otros.
Disponible en abril de 2002, el 5.000° texto es "The Notebooks of Leonardo da Vinci" (Los cuadernos de Leonardo da Vinci), que datan de inicios de siglo XVI. En 2008, este texto aún se encuentra en el Top 100 de los libros descargados con más frecuencia.
En 1988, Michael Hart decidió digitalizar "Alice’s Adventures in Wonderland" (Las aventuras de Alicia en el país de las maravillas) o "Peter Pan" porque su versión digital cupo en un disquete de 360 Ko, o sea el estándar de la época. Quince años más tarde, en 2002, ya disponemos de disquetes de 1,44 M (megabytes) y resulta muy sencillo comprimir archivos en archivos ZIP. Un archivo estándar puede contener tres millones de caracteres, o sea más de los necesarios para un libro de tamaño mediano, ya que una novela de 300 páginas digitalizada en formato ASCII representa 1 M (megabyte). Un libro voluminoso cabe en dos archivos ASCII, descargables en versión normal o en versión comprimida. Se necesitan unas cincuenta horas para seleccionar un libro de tamaño mediano, comprobar que ha pasado al dominio público, escanearlo, corregirlo, formatearlo y compaginarlo.
Algunos números de libros se reservan para más tarde, por ejemplo el número 1984 (eBook #1984) para la novela epónima de George Orwell, publicada en 1949, que aún está lejos de pasar al dominio público.
En 2002, las colecciones se amplían de 203 títulos al mes. Al llegar la primavera de 2002, ya cubren un cuarto de las obras del dominio público de libre acceso en la web, inventariadas de forma casi exhaustiva por la Internet Public Library (IPL). Un buen resultado, fruto del trabajo paciente de miles de voluntarios activos en numerosos países.
1.000 libros en agosto de 1997, 2.000 libros en mayo de 1999, 3.000 libros en diciembre de 2000, 4.000 libros en octubre de 2001, 5.000 libros en abril de 2002, 10.000 libros en octubre de 2003. El 10.000° libro es "The Magna Carta", que fue el primer texto constitucional inglés, firmado en 1215.
Entre abril de 2002 y octubre de 2003, las colecciones se duplican, pasando de 5.000 a 10.000 libros en dieciocho meses. En 2003, se digitalizan de promedio unos 348 libros al mes.
Diez mil libros: una cifra impresionante si uno piensa en lo que aquello representa en términos de páginas escaneadas, releídas y corregidas. Este crecimiento rápido se debe a la actividad de Distributed Proofreaders (DP), un sitio web concebido en 2000 por Charles Franks para repartir la corrección de las obras entre varias personas. Los voluntarios eligen uno de los libros cuya digitalización ya ha empezado para releer y corregir determinada página. Cada cual trabaja a su ritmo. A título indicativo, en el sitio web se aconseja repasar una página al día. Representa poco tiempo en un día, pero mucho para el proyecto.
En agosto de 2003, se pone a disposición un CD "Best of Gutenberg" con una selección de 600 libros. En diciembre de 2003, fecha en la que el Proyecto Gutenberg alcanza la cifra de 10.000 libros, se graba en un DVD la casi totalidad de los libros (9.400 libros). Se envían gratuitamente el CD y el DVD a cualquier persona que lo pida. Luego cada uno queda libre de realizar todas las copias que pueda y de distribuirlas a su alrededor.
# De 10.000 à 20.000 ebooks
En diciembre de 2003, las colecciones rondan los 11.000 libros. Varios formatos están representados (HTML, XML, RTF, etc.) pero el formato principal - y obligatorio - sigue siendo el ASCII. Hay 46.000 archivos en conjunto, lo que equivale a una capacidad total de 110 G (gigabytes). El 13 de febrero de 2004, fecha en la que Michael Hart da una conferencia en la sede de la UNESCO en París, las colecciones abarcan exactamente 11.340 libros en 25 idiomas diferentes. En mayo de 2004, los 12.500 libros disponibles representan 100.000 archivos en veinte formatos diferentes, lo que equivale a una capacidad total de 135 G (gigabytes), y ésta debería duplicarse cada año con la agregación de más de 300 libros al mes (338 libros en 2004).
Al mismo tiempo, el Project Gutenberg Consortia Center (PGCC), lanzado en 1997 para reunir colecciones de libros digitales en un punto de acceso único, es afiliado oficialmente al Proyecto Gutenberg en 2003.
En otro ámbito, se inicia un proyecto europeo a iniciativa del Proyecto Rastko, basado en Belgrado (Serbia). Distributed Proofreaders Europa nace en diciembre de 2003, y el Proyecto Gutenberg Europa en enero de 2004, con cien libros disponibles para abril de 2005. Aparecen libros en varios idiomas con el fin de reflejar la diversidad lingüística que prevalece en Europa, y a largo plazo la intención es proponer documentos en cien idiomas.
En enero de 2005, el Proyecto Gutenberg celebra sus 15.000 libros, al poner en línea "The Life of Reason" de George Santayana (publicado en 1906).
En junio de 2005, se alcanzan los 16.000 libros. Si bien en febrero de 2004 sólo había textos en 25 idiomas, en julio de 2005 están representados 42 idiomas, entre los cuales el sanscrito y las lenguas maya. En diciembre de 2006 figuran 50 idiomas. El 16 de diciembre de 2006, varios idiomas cuentan con colecciones de más de 50 títulos: el inglés (17.377 libros), el francés (966 títulos), el alemán (412 títulos), el finlandés (344 títulos), el holandés (244 títulos), el español (140 títulos), el italiano (102 títulos), el chino (69 títulos), el portugués (68 títulos) y el tagalog (51 títulos).
Lanzado en agosto de 2001, el Proyecto Gutenberg of Australia celebra sus 500 libros en julio de 2005. En la misma fecha, el Proyecto Gutenberg Canadá aún está en gestación, así como un Proyecto Gutenberg en Portugal y uno en las Filipinas.
En diciembre de 2006, el Proyecto Gutenberg alcanza los 20.000 libros. El 20.000° libro es un libro audio, "Twenty Thousand Leagues Under the Sea" (Veinte mil leguas de viaje submarino), la versión inglesa de la novela de Julio Verne (publicada en 1869). En 2006, se digitalizan de promedio unos 345 libros nuevos al mes. Aunque se hayan necesitado 32 años para digitalizar los 10.000 primeros libros – de julio de 1971 a octubre de 2003 – bastará con sólo tres años y dos meses, de octubre de 2003 a diciembre de 2006, para digitalizar los 10.000 libros siguientes.
Por la misma fecha, el Proyecto Gutenberg of Australia ronda los 1.500 libros (se alcanzará esta cifra en abril de 2007) y el Proyecto Gutenberg Europa cuenta con 400 libros.
En enero de 2006 se crea la sección Project Gutenberg PrePrints para acoger nuevos documentos que por su interés merecerían estar en línea, pero que no pueden ser incorporados a las colecciones existentes sin su procesamiento previo por voluntarios: colecciones incompletas, calidad insuficiente, necesidad de conversión a otro formato, etc. Esta sección comprende 379 títulos en diciembre de 2006, y más de 2.000 títulos dos años más tarde.
# Decenas de miles de ebooks
Se estrena el sitio web Project Gutenberg News a principios de noviembre de 2006 a instigación de Mike Cook. Este sitio es complementario al de la carta de información semanal y mensual que ya llevaba muchos años de existencia. El sitio presenta por ejemplo las estadísticas de producción semanales, mensuales y anuales desde 2001. La producción semanal se eleva a 24 libros en 2001, 47 libros en 2002, 79 libros en 2003, 78 libros en 2004, 58 libros en 2005, 80 libros en 2006 y 78 libros en 2007. La producción mensual es de 104 libros en 2001, 203 libros en 2002, 348 libros en 2003, 338 libros en 2004, 252 libros en 2005, 345 libros en 2006 y 338 libros en 2007. La producción anual es de 1.244 libros en 2001, 2.432 libros en 2002, 4.176 libros en 2003, 4.058 libros en 2004, 3.019 libros en 2005, 4.141 libros en 2006 y 4.049 libros en 2007.
El Proyecto Gutenberg Canadá (PGC) ve la luz el 1° de julio de 2007, día de la fiesta nacional, a instigación de Michael Shepard y David Jones. Poco después nace Distributed Proofreaders Canadá (DPC) cuya producción empieza en 2007. Los cien primeros libros están disponibles en marzo de 2008, con libros en inglés, en francés y en italiano.
Distributed Proofreaders (DP), lanzado en octubre de 2000, cuenta con 52.000 voluntarios en enero de 2008, con un total de 11.934 libros procesados en siete años y tres meses. Distributed Proofreaders Europa (DP Europe), lanzado en diciembre 2003, contabiliza 1.500 voluntarios. Distributed Proofreaders Canadá (DPC), lanzado en diciembre de 2007, contabiliza 250 voluntarios.
El Proyecto Gutenberg alcanza los 25.000 libros en abril de 2008. El 25.000° libro es "English Book Collectors" de William Younger Fletcher (publicado en 1902).
El Proyecto Gutenberg Europa alcanza los 500 libros en octubre de 2008.
El Proyecto Gutenberg contabiliza 32.500 ebooks el 1° de marzo de 2009 – si se toma en cuenta el conjunto de sus sitios web –, de los cuales 28.147 ebooks para el Proyecto Gutenberg USA, 1.750 ebooks para el Proyecto Gutenberg Australia, 600 ebooks para el Proyecto Gutenberg Europa y 250 ebooks para el Proyecto Gutenberg Canadá, a los que conviene añadir los 2.020 ebooks de la sección PrePrints. En la misma fecha el Project Gutenberg Consortia Center (PGCC), que reúne varias colecciones de libros digitalizados, cuenta con 75.000 ebooks.
Para el Proyecto Gutenberg original (28.147 ebooks), los diez idiomas más representados en marzo de 2009 son los siguientes: inglés (23,761 ebooks el 6 de marzo 2009), francés (1.387 ebooks), alemán (570 ebooks), finlandés (491 ebooks), chino (399 ebooks), holandés (408 ebooks), portugués (307 ebooks), español (226 ebooks) e italiano (180 ebooks).
= Desde el pasado hacia el futuro
Michael Hart ha ganado entonces la apuesta hecha en 1971, con una progresión impresionante si uno piensa en el número de páginas que han sido releídas y corregidas en total. Sin embargo los resultados del Proyecto Gutenberg no se miden sólo en cifras. Los resultados se miden también por la influencia que ha tenido el proyecto, pues ésta ha sido enorme. El Proyecto Gutenberg – primera página web de información en el internet y primera biblioteca digital –, inspiró entre tanto a muchas otras bibliotecas digitales, por ejemplo el Projekt Runeberg para la literatura escandinava o el Projekt Gutenberg-DE para la literatura alemana, para no citar sino a dos de ellos.
La estructura administrativa y financiera del Proyecto Gutenberg se limita al mínimo estricto. Michael Hart insiste frecuentemente sobre la necesidad de preservar un marco lo más flexible posible que deje campo libre a los voluntarios, y la puerta abierta para las nuevas ideas. El objetivo es garantizar la perennidad del proyecto, sin depender ni de créditos y cortes de créditos, ni de las prioridades culturales, financieras y políticas del momento. De este modo no puede ejercerse ninguna forma de presión por el poder o el dinero. Además esto significa respeto para con los voluntarios, quienes pueden estar seguros de que verán su trabajo utilizado durante muchos años, o incluso durante muchas generaciones, de ahí el interés que presenta un formato digital que aún sea válido dentro de algunos siglos. En cuanto a la supervisión regular del proyecto, se garantiza gracias a una carta de información semanal y mensual, foros de discusión, wikis y blogs.
Las donaciones sirven para financiar ordenadores y escáneres, y para enviar CD y DVD gratuitos a aquéllos que los solicitan. Después del CD "Best of Gutenberg" disponible en agosto de 2003 con una selección de 600 títulos y de un primer DVD disponible en diciembre de 2003 con 9.400 títulos, un segundo DVD se pone a disposición en julio de 2006 con 17.000 títulos. A partir de 2005, CD y DVD ambos están disponibles en el sitio web de BitTorrent bajo la forma de imágenes ISO. Estas se pueden descargar con el fin de grabar luego CD y DVD a título personal. En 2007, el Proyecto Gutenberg envía 15 millones de libros por correo postal bajo la forma de CD y DVD.
Aunque demasiadas veces se silencie, cabe recordar que el verdadero inventor del ebook es Michael Hart. Si tomamos la palabra "ebook" en su sentido etimológico – a saber un libro digital para difusión bajo la forma de un archivo electrónico – resulta que éste casi tendría cuarenta años y habría nacido con el Proyecto Gutenberg en julio de 1971. Ésta es una paternidad mucho más reconfortante que los diversos lanzamientos comerciales en formato propietario que salpicaron el principio de los años 2000. No hay ningún motivo para que la denominación "ebook" designe sólo el ebook comercial y sea exclusiva de entidades como Amazon, Barnes & Noble, Gemstar y demás. El ebook no comercial es un ebook de pleno derecho, y no un pariente pobre, así como la edición electrónica no comercial es una forma de edición de pleno derecho, y tan válida como la edición comercial.
En julio de 1971, el envío de un archivo de 5 K (kilobytes) a cien personas hubiera acabado con el embrión de red disponible en aquella época. En noviembre de 2002, el Proyecto Gutenberg es capaz de poner en línea los 75 archivos del "Human Genome Project" (Proyecto Genoma Humano, es saber la secuenciación del genoma humano), a pesar de que cada archivo se compone de decenas, o incluso de cientos de megabytes. Y esto ocurre poco tiempo después de su publicación inicial en febrero de 2001, debido a que desde el principio ya pertenecía al dominio público. En 2004, la capacidad de almacenamiento de los discos duros ya es tal que sería posible almacenar la integralidad de la Library of Congress en formato texto en un soporte de un valor de 140 dólares US. Y por lo visto dentro de unos pocos años aparecerá una llave USB (universal serial bus) capaz de almacenar la integralidad del patrimonio escrito de la humanidad.
¿Y qué pasa con los documentos que no pertenecen al mundo escrito? En septiembre de 2003, el Proyecto Gutenberg se lanza en un proyecto de difusión de libros audio. En diciembre de 2006, están disponibles unos 367 libros leídos por una síntesis de voz (en la sección "Audio Books, computer-generated") y 132 libros leídos por el ser humano (en la sección "Audio Books, human-read"). La cantidad de libros leídos por un ser humano debería ir creciendo, pero los libros leídos por una síntesis de voz ya no serán almacenados en una sección específica, sino generados a petición del usuario a partir de archivos electrónicos preexistentes en las colecciones generales. En el futuro, los lectores ciegos o deficientes visuales podrán utilizar una función de control de voz para pedir uno de esos libros digitales.
La colección "Sheet Music Subproject", lanzada también en septiembre de 2003, está dedicada a las partituras musicales digitalizadas (en la sección "Music, Sheet"). Viene completada por una sección de grabaciones musicales (Music, recorded). También hay secciones reservadas para las imágenes fijas (Pictures, still) y animadas (Pictures, moving). Esas nuevas colecciones deberían desarrollarse durante los años que vienen.
Sin embargo, la prioridad sigue siendo la digitalización de libros. Y la demanda es enorme, a prueba de ello el número de descargas, que ahora se cifran en decenas de miles diarias. A fecha del 31 de julio de 2005, se cuenta con 37.532 archivos descargados al día, 243.808 archivos a la semana y 1.154.765 archivos al mes. A fecha del 6 de mayo 2007, se han descargado 89.841 archivos al día, 697.818 a la semana y 2.995.436 al mes. Y esto sólo concierne el sitio web de descargas principal, ibiblio.org (basado en la Universidad de Carolina del Norte, Estados Unidos), que alberga también el sitio web del Proyecto Gutenberg. El segundo sitio web de descargas es el del Internet Archive, que también sirve de copia de seguridad y le proporciona al Proyecto Gutenberg une capacidad de almacenamiento ilimitada.
Un Top 100 inventaria los cien títulos y los cien autores que más han sido descargados durante el día, la semana y el mes.
El Proyecto Gutenberg dispone de 40 sitios web espejo repartidos entre múltiples países, y aún necesita encontrar otros. Los archivos también circulan en modo P2P (peer-to-peer), lo que permite a cualquier utilizador intercambiar directamente archivos con otro utilizador.
Los libros del Proyecto Gutenberg pueden ayudar a colmar la fractura digital. Es muy sencillo descargarlos en una PDA (asistente personal). Un ordenador o una PDA de segunda mano no cuestan más de unos dólares o decenas de dólares, en función del modelo. Algunas PDA funcionan con energía solar, lo que permite un acceso a la lectura en las regiones pobres y remotas.
Más adelante, quizás se pueda contemplar la idea de una traducción simultánea a unos cien idiomas, utilizando un programa de traducción automática con un margen de fiabilidad del orden de 99%, aunque de momento aún falte mucho par alcanzar este porcentaje. Los textos generados por el software de traducción automática pasarían luego en manos de traductores (no máquinas, sino seres humanos) para hacerles algunos retoques, siguiendo un modelo parecido al de la tecnología OCR, que no puede prescindir de los correctores (no de los software, sino de los seres humanos) para ofrecer un contenido de calidad óptima.
38 años después de la creación del Proyecto Gutenberg, Michael Hart se define aún como un adicto al trabajo que sigue dedicándose enteramente a su proyecto, proyecto que en su opinión está al origen de una revolución neo-industrial. Se define también a sí mismo como un altruista, pragmático y visionario. Tras haber sido tildado de chiflado durante años, ahora suscita el respeto.
Con el pasar de los años, la misión del Proyecto Gutenberg nunca ha dejado de ser la misma, a saber la de cambiar el mundo mediante el ebook gratuito, de uso infinito y repetible. El objetivo también sigue siendo el mismo, es decir la lectura y la cultura para todos a coste reducido. En cuanto a la misión, se resume en pocas palabras: "fomentar la creación y la distribución de los ebooks", por cuantas personas sea posible, y por todos los medios posibles. Y aceptando también los virajes necesarios para integrar nuevas ideas, nuevos métodos y nuevos soportes.