Début 2004, 25 langues sont représentées. En juillet 2005, 42 langues sont représentées, dont l’iroquois, le sanscrit et les langues mayas. Outre l’anglais (14 548 livres le 27 juillet 2005), six langues disposent de plus de cinquante titres: le français (577 livres), l’allemand (349 livres), le finnois (218 livres), le hollandais (130 livres), l’espagnol (103 livres) et le chinois (69 livres). En décembre 2006, 50 langues sont représentées. Les langues comprenant plus de 50 titres sont l’anglais (17 377 livres le 16 décembre 2006), le français (966 titres), l’allemand (412 titres), le finnois (344 titres), le hollandais (244 titres), l’espagnol (140 titres), l’italien (102 titres), le chinois (69 titres), le portugais (68 titres) et le tagalogue (51 titres).

La quantité de livres progresse rapidement pour chaque langue. Pour le français par exemple, sur 11 340 livres disponibles le 13 février 2004, on comptait seulement 181 livres en français. Sur 15 505 livres disponibles le 16 mai 2005, on compte 547 livres en français. Soit trois fois plus en quinze mois. Sur 19 996 livres disponibles le 16 décembre 2006, on compte 966 livres en français, soit un peu moins du double en dix-huit mois. Le mouvement devrait sensiblement s’accélérer avec le lancement du Projet Gutenberg Europe en janvier 2004.

Les premiers titres disponibles dans la langue de Molière sont six romans de Stendhal et deux romans de Jules Verne, tous mis en ligne au début de 1997. Les six romans de Stendhal sont L’Abbesse de Castro, Les Cenci, La Chartreuse de Parme, La Duchesse de Palliano, Le Rouge et le Noir et Vittoria Accoramboni, et les deux romans de Jules Verne De la terre à la lune et Le tour du monde en quatre-vingts jours. A la même date, si aucun titre de Stendhal n’est disponible en anglais, trois romans de Jules Verne le sont : 20,000 Leagues Under the Seas (Vingt mille lieues sous les mers, mis en ligne en septembre 1994), Around the World in 80 Days (Le tour du monde en quatre-vingts jours, mis en ligne en janvier 1994) et From the Earth to the Moon (De la terre à la lune, mis en ligne en septembre 1993). Stendhal et Jules Verne sont suivis par Edmond Rostand avec Cyrano de Bergerac, mis en ligne en mars 1998.

A la fin de 1999, le «Top 20», à savoir la liste des vingt auteurs les plus lus, mentionne Jules Verne à la onzième place, et Emile Zola à la seizième place. Ils sont toujours en bonne position dans le «Top 100» actuel.

A titre anecdotique, le premier document illustré disponible toutes langues confondues est French Cave Paintings (Peintures des cavernes en France), mis en ligne dès avril 1995, avec une version XHTML ajoutée en novembre 2000. Il s’agit de quatre photos de peintures paléolithiques retrouvées dans une grotte de l’Ardèche (département de la région Rhône-Alpes). Ces photos sous droits ont été mises à la disposition du Projet Gutenberg par Jean Clottes, conservateur général du patrimoine, pour être largement diffusées.

En 2004, le multilinguisme devient l’une des priorités du Projet Gutenberg, tout comme l’internationalisation. Michael Hart prend son bâton de pèlerin vers l’Europe, avec des étapes à Bruxelles, Paris et Belgrade. Le 12 février 2004, il donne une conférence au siège de l’UNESCO (Organisation des Nations Unies pour l’éducation, la science et la culture) à Paris. Le lendemain, toujours à Paris, il anime un débat à l’Assemblée nationale. La semaine suivante, il s’adresse au Parlement européen à Bruxelles. Puis il rend visite à l’équipe du Projet Rastko à Belgrade, pour soutenir la création du Projet Gutenberg Europe (PG Europe) et de Distributed Proofreaders Europe (DP Europe).

Le lancement de DP Europe par le Projet Rastko en janvier 2004 représente une étape importante. DP Europe est calqué sur le site original de Distributed Proofreaders, pour gérer la relecture partagée du Projet Gutenberg Europe. Dès ses débuts, DP Europe est un site multilingue, qui prend en compte les principales langues nationales. En avril 2004, grâce à des traducteurs volontaires, le site de DP Europe est disponible en douze langues. L’objectif à moyen terme est soixante langues, et donc soixante équipes linguistiques, avec prise en compte de toutes les langues européennes. Quand il aura atteint sa vitesse de croisière, DP Europe devrait alimenter plusieurs bibliothèques numériques nationales et/ou linguistiques, par exemple le Projet Gutenberg France pour la France. Le but étant que chaque pays ou région ait son propre accès réseau autorisé (respectant la législation en vigueur dans le pays donné), qui sera un accès local au sein d’un réseau continental (dans le cas de la France, le réseau européen) et d’un réseau global (à l’échelle de la planète).

Quelques mots maintenant sur le Projet Rastko, qui s’est porté volontaire pour un pari aussi fou, catalysant du même coup les bonnes volontés européennes à l’est comme à l’ouest. Fondé en 1997, le Projet Rastko est une initiative non gouvernementale à vocation culturelle et pédagogique. L’un de ses objectifs est la mise en ligne de la culture serbe. Il fait partie de la Balkans Cultural Network Initiative, un réseau culturel régional couvrant la péninsule des Balkans, située au sud-est de l’Europe.

En mai 2005, Distributed Proofreaders Europe fête le centième livre numérisé par ses soins, avec mise en ligne de ces cent livres le mois suivant sur le site du Projet Gutenberg Europe. En décembre 2006, DP Europe comptabilise 400 livres numérisés. La règle utilisée pour définir le domaine public est l’équation «décès de l’auteur + 70 ans», qui correspond à la législation en vigueur dans l’Union européenne. DP Europe utilise l’Unicode pour pouvoir traiter des livres dans un grand nombre de langues. Créé en 1991 et largement répandu à partir de 1998, l’Unicode est un système d’encodage qui attribue un code unique à chaque caractère pour être en mesure de traiter toutes les langues, contrairement à l’ASCII qui ne peut traiter que l’anglais et quelques langues européennes.

3.5. Du passé vers l’avenir