Avec le développement du web, l’échange des données s’internationalise de plus en plus, et ne peut donc plus se limiter à l’utilisation de l’anglais et de quelques langues européennes, traduites par un système d’encodage datant des années 1960. Fondé en janvier 1991, l’Unicode Consortium regroupe des sociétés informatiques, des sociétés commercialisant des bases de données, des concepteurs de logiciels, des organismes de recherche et différents groupes d’usagers. Il a pour tâche de développer l’Unicode, un système d’encodage sur 16 bits spécifiant un nombre unique pour chaque caractère, et de donner toutes les explications techniques nécessaires aux usagers potentiels.

Les usagers non anglophones étant de plus en plus nombreux, l’Unicode répond partiellement à leurs problèmes, puisqu’il est lisible quels que soient la plate-forme, le logiciel et la langue utilisés. Il peut traiter 65.000 caractères uniques, et donc prendre en compte tous les systèmes d’écriture de la planète. L’Unicode (qui, en 2003, en est à sa 4e version) remplace progressivement l’ASCII. Les versions récentes du système d’exploitation Windows de Microsoft (Windows 2000, Windows XP, Windows NT, Windows Server 2003) utilisent l’Unicode pour les fichiers texte, alors que les versions précédentes utilisaient l’ASCII.

Mais l’Unicode ne peut résoudre tous les problèmes, comme le souligne en juin 2000 Luc Dall’Armellina, co-auteur et webmestre d’oVosite, un espace d’écritures multimédias: "Les systèmes d’exploitation se dotent peu à peu des kits de langues et bientôt peut-être de polices de caractères Unicode à même de représenter toutes les langues du monde; reste que chaque application, du traitement de texte au navigateur web, emboîte ce pas. Les difficultés sont immenses: notre clavier avec ses ± 250 touches avoue ses manques dès lors qu’il faille saisir des Katakana ou Hiragana japonais, pire encore avec la langue chinoise. La grande variété des systèmes d’écritures de par le monde et le nombre de leurs signes font barrage. Mais les écueils culturels ne sont pas moins importants, liés aux codes et modalités de représentation propres à chaque culture ou ethnie."

Que préconise Olivier Gainon, créateur de CyLibris et pionnier de l’édition littéraire en ligne? "Première étape: le respect des particularismes au niveau technique, explique-t-il en décembre 2000. Il faut que le réseau respecte les lettres accentuées, les lettres spécifiques, etc. Je crois très important que les futurs protocoles permettent une transmission parfaite de ces aspects - ce qui n’est pas forcément simple (dans les futures évolutions de l’HTML, ou des protocoles IP, etc.). Donc, il faut que chacun puisse se sentir à l’aise avec l’internet et que ce ne soit pas simplement réservé à des (plus ou moins) anglophones. Il est anormal aujourd’hui que la transmission d’accents puisse poser problème dans les courriers électroniques. La première démarche me semble donc une démarche technique. Si on arrive à faire cela, le reste en découle: la représentation des langues se fera en fonction du nombre de connectés, et il faudra envisager à terme des moteurs de recherche multilingues."

En été 2000, les usagers non anglophones dépassent la barre des 50%. Ce pourcentage continue ensuite de progresser, comme le montrent les statistiques de la société Global Reach, mises à jour à intervalles réguliers. Le nombre d’usagers non anglophones est de 52,5% en été 2001, 57% en décembre 2001, 59,8% en avril 2002 et 63,5% en été 2003 (dont 35,5% d’Européens non anglophones et 28,3% d’Asiatiques).

9.2. Des communautés linguistiques

"Comme l’internet n’a pas de frontières nationales, les internautes s’organisent selon d’autres critères propres au médium", écrit en septembre 1998 Randy Hobler, consultant en marketing internet de produits et services de traduction. "En termes de multilinguisme, vous avez des communautés virtuelles, par exemple ce que j’appelle les 'nations des langues', tous ces internautes qu’on peut regrouper selon leur langue maternelle quel que soit leur lieu géographique. Ainsi la nation de la langue espagnole inclut non seulement les internautes d’Espagne et d’Amérique latine, mais aussi tous les hispanophones vivant aux Etats-Unis, ou encore ceux qui parlent espagnol au Maroc."

= L’anglais reste prépondérant

Principale langue d’échange internationale, l’anglais reste prépondérant et ceci n’est pas près de disparaître. Comme l’indique en janvier 1999 Marcel Grangier, responsable de la section française des services linguistiques centraux de l’Administration fédérale suisse, "cette suprématie n’est pas un mal en soi, dans la mesure où elle résulte de réalités essentiellement statistiques (plus de PC par habitant, plus de locuteurs de cette langue, etc.). La riposte n’est pas de 'lutter contre l’anglais' et encore moins de s’en tenir à des jérémiades, mais de multiplier les sites en d’autres langues. Notons qu’en qualité de service de traduction, nous préconisons également le multilinguisme des sites eux-mêmes. La multiplication des langues présentes sur internet est inévitable, et ne peut que bénéficier aux échanges multiculturels."

Dès décembre 1998, Henri Slettenhaar, professeur en technologies des communications à la Webster University de Genève, insiste sur la nécessité de sites bilingues, dans la langue originale et en anglais. "Les communautés locales présentes sur le web devraient en tout premier lieu utiliser leur langue pour diffuser des informations. Si elles veulent également présenter ces informations à la communauté mondiale, celles-ci doivent être aussi disponibles en anglais. Je pense qu'il existe un réel besoin de sites bilingues. (…) Mais je suis enchanté qu'il existe maintenant tant de documents disponibles dans leur langue originale. Je préfère de beaucoup lire l'original avec difficulté plutôt qu'une traduction médiocre." En août 1999, il ajoute: "A mon avis, il existe deux types de recherches sur le web. La première est la recherche globale dans le domaine des affaires et de l’information. Pour cela, la langue est d’abord l’anglais, avec des versions locales si nécessaire. La seconde, ce sont les informations locales de tous ordres dans les endroits les plus reculés. Si l’information est à destination d'une ethnie ou d'un groupe linguistique, elle doit d'abord être dans la langue de l’ethnie ou du groupe, avec peut-être un résumé en anglais."