Patrick Rebollar, professeur de littérature française au Japon et modérateur de la liste de diffusion LITOR (littérature et ordinateur), donne son sentiment en janvier 2000: "Il s'agit d'abord d'un problème logiciel. Comme on le voit avec Netscape ou Internet Explorer, la possibilité d'affichage multilingue existe. La compatibilité entre ces logiciels et les autres (de la suite Office de Microsoft, par exemple) n'est cependant pas acquise. L'adoption de la table Unicode devrait résoudre une grande partie des problèmes, mais il faut pour cela réécrire la plupart des logiciels, ce à quoi les producteurs de logiciels rechignent du fait de la dépense, pour une rentabilité qui n'est pas évidente car ces logiciels entièrement multilingues intéressent moins de clients que les logiciels de navigation."
= ASCII et/ou Unicode
Le Projet Gutenberg est fondé dès 1971 par Michael Hart pour numériser les oeuvres littéraires et les mettre gratuitement à la disposition de tous. Qu’elles aient été numérisées il y a des années ou qu’elles soient numérisées maintenant, toutes les oeuvres sont numérisées en mode texte, en utilisant l’ASCII original sur sept bits ou, pour les langues avec accents, l'ASCII sur huit bits prenant en compte les caractères accentués. Mais, même dans ce cas, le Projet Gutenberg propose aussi systématiquement en complément une version ASCII sur sept bits sans accents. Sauf, bien entendu, dans le cas de langues non encodables en ASCII, comme le chinois, qui est encodé au format Big-5.
Surnommé à juste raison "le plus petit dénominateur commun", l'ASCII sur sept bits est le seul format compatible avec 99% des machines et des logiciels, et pouvant être converti dans de nombreux autres formats. Il sera toujours utilisé quand d’autres formats auront disparu, à commencer par les formats éphémères liés à quelques appareils de lecture lancés entre 1999 et 2003 et déjà disparus du marché. Il est l’assurance que les collections ne deviendront jamais obsolètes, et survivront aux changements technologiques des prochaines décennies ou même des prochains siècles. Il n'existe pas d'autre standard aussi largement utilisé, y compris l'Unicode, système d'encodage "universel" créé en 1991. Ce jusqu'en 2008, date à laquelle les deux systèmes d'encodage sont également représentés sur le web.
Le Projet Gutenberg propose certains livres dans d’autres formats que l'ASCII, notamment dans les trois formats répandus que sont les formats HTML, XML et RTF. Des fichiers Unicode sont également présents. De plus, tout format proposé par tel ou tel volontaire est généralement accepté (PDF, LIT, TeX et beaucoup d'autres), dans la mesure où un fichier ASCII est également présent.
En ce qui concerne les langues, le Projet Gutenberg est essentiellement anglophone, puisqu’il est basé aux États-Unis et qu'il sert en priorité la communauté anglophone nationale et internationale. En octobre 1997, Michael Hart annonce son intention d'intensifier la production de livres dans des langues autres que l'anglais. Début 1998, le catalogue comprend quelques oeuvres en allemand, en espagnol, en français (dix titres), en italien et en latin. En juillet 1999, Michael écrit: "J'introduis une nouvelle langue par mois maintenant, et je vais poursuivre cette politique aussi longtemps que possible."
Le multilinguisme devient ensuite l'une des priorités du Projet Gutenberg, tout comme l'internationalisation, avec le Project Gutenberg Australia (créé en août 2001), le Projet Gutenberg Europe (créé en janvier 2004), le Project Gutenberg Canada (créé en juillet 2007), et d'autres Projet Gutenberg à venir dans divers pays. Dans le Projet Gutenberg original, 25 langues sont représentées en janvier 2004 et 42 langues en juillet 2005. Dès ses débuts en janvier 2004, Distributed Proofreaders Europe (DP Europe) est un site multilingue, qui prend en compte les principales langues nationales. Ce site est calqué sur le site original de Distributed Proofreaders, pour gérer la relecture partagée entre les volontaires. En avril 2004, grâce à des traducteurs volontaires, le site de DP Europe est disponible en douze langues. L'objectif à moyen terme est un site en soixante langues, et donc soixante équipes linguistiques, avec prise en compte de toutes les langues européennes. DP Europe utilise l'Unicode et non l'ASCII, pour pouvoir traiter des livres dans un grand nombre de langues.
PREMIERS PROJETS MULTILINGUES
= [Citation]
Tyler Chambers, créateur de deux projets sur le web - Human-Languages Page (Page des langues humaines) et Internet Dictionary Project (Projet de dictionnaires internet) - relate en septembre 1998: "Mon activité en ligne a été de rendre des données linguistiques accessibles à davantage de gens par le biais de deux de mes projets sur le web. Bien que je ne sois pas multilingue, ni même bilingue moi-même, je suis conscient du fait que très peu de domaines ont une importance comparable à celle des langues et du multilinguisme. (…) Dans l'ensemble, je pense que le web est important pour la sensibilisation aux langues et pour les questions culturelles. Dans quel autre endroit peut-on chercher au hasard pendant vingt minutes et trouver des informations susceptibles de vous intéresser dans trois langues différentes sinon plus?"