De pratiquement anglophone à ses débuts, le web, devenu multilingue en 2000, permet une large diffusion des textes électroniques sans contrainte de frontières. Mais la barrière de la langue est loin d’avoir disparu. Que préconise Olivier Gainon, fondateur des éditions CyLibris? «Première étape: le respect des particularismes au niveau technique, explique-t-il en décembre 2000. Il faut que le réseau respecte les lettres accentuées, les lettres spécifiques, etc. Je crois très important que les futurs protocoles permettent une transmission parfaite de ces aspects - ce qui n’est pas forcément simple (dans les futures évolutions de l’HTML ou des protocoles IP, etc.). Donc il faut que chacun puisse se sentir à l’aise avec l’internet et que ce ne soit pas simplement réservé à des (plus ou moins) anglophones. Il est anormal aujourd’hui que la transmission d’accents puisse poser problème dans les courriers électroniques. La première démarche me semble donc une démarche technique. Si on arrive à faire cela, le reste en découle: la représentation des langues se fera en fonction du nombre de connectés, et il faudra envisager à terme des moteurs de recherche multilingues.»

= Premiers pas

A tort ou à raison, on se plaint souvent de l’hégémonie de l’anglais sur l’internet. Celle-ci était inévitable au début, puisque le réseau se développe d’abord en Amérique du Nord avant de s'étendre au monde entier. En 1997, on note déjà la présence de nombreuses langues, cette présence dépendant du dynamisme de chaque communauté linguistique. En décembre 1997, Tim Berners-Lee, inventeur du web, déclare à Pierre Ruetschi, journaliste à la Tribune de Genève, un quotidien suisse: «Pourquoi les Francophones ne mettent-ils pas davantage d’informations sur le web? Est-ce qu’ils pensent que personne ne veut la lire, que la culture française n’a rien à offrir? C’est de la folie, l’offre est évidemment énorme.» C’est chose faite dans les années qui suivent.

Consultant en marketing internet de produits et services de traduction, Randy Hobler écrit en septembre 1998: «Comme l’internet n’a pas de frontières nationales, les internautes s’organisent selon d’autres critères propres au médium. En termes de multilinguisme, vous avez des communautés virtuelles, par exemple ce que j’appelle les "nations des langues", tous ces internautes qu’on peut regrouper selon leur langue maternelle quel que soit leur lieu géographique. Ainsi la nation de la langue espagnole inclut non seulement les internautes d’Espagne et d’Amérique latine, mais aussi tous les Hispanophones vivant aux Etats- Unis, ou encore ceux qui parlent espagnol au Maroc.»

En 1998 et 1999, la nécessité d’un web multilingue occupe tous les esprits. Au début des années 2000, le web, devenu multilingue, permet une large diffusion des textes électroniques sans contrainte de frontières, mais la barrière de la langue est loin d’avoir disparu. La priorité semble être la création de passerelles entre les communautés linguistiques pour favoriser la circulation des écrits dans d’autres langues, en améliorant notamment les outils de traduction.

Au cours de l'été 2000, les usagers non anglophones dépassent la barre des 50%. Ce pourcentage continue ensuite d'augmenter, comme le montrent les statistiques de la société Global Reach, mises à jour à intervalles réguliers. Le nombre d’usagers non anglophones est de 52,5% en été 2001, 57% en décembre 2001, 59,8% en avril 2002, 64,4% en septembre 2003 (dont 34,9% d’Européens non anglophones et 29,4% d’Asiatiques) et 64,2% en mars 2004 (dont 37,9% d’Européens non anglophones et 33% d’Asiatiques).

Bruno Didier, webmestre de la Bibliothèque de l’Institut Pasteur, écrit en août 1999: «Internet n’est une propriété ni nationale, ni linguistique. C’est un vecteur de culture, et le premier support de la culture, c’est la langue. Plus il y a de langues représentées dans leur diversité, plus il y aura de cultures sur internet. Je ne pense pas qu’il faille justement céder à la tentation systématique de traduire ses pages dans une langue plus ou moins universelle. Les échanges culturels passent par la volonté de se mettre à la portée de celui vers qui on souhaite aller. Et cet effort passe par l’appréhension de sa langue. Bien entendu c’est très utopique comme propos. Concrètement, lorsque je fais de la veille, je peste dès que je rencontre des sites norvégiens ou brésiliens sans un minimum d’anglais.»

Dès décembre 1997, le moteur de recherche AltaVista lance Babel Fish Translation, un logiciel de traduction automatique de l’anglais vers cinq autres langues (allemand, espagnol, français, italien, portugais), et vice versa. Alimenté par un dictionnaire multilingue de 2,5 millions de mots, ce service gratuit est l’oeuvre de Systran, société pionnière en traitement automatique des langues. Le texte à traduire doit être de trois pages maximum. La page originale et la traduction apparaissent en vis-à-vis à l’écran. La traduction étant entièrement automatisée, elle est évidemment approximative. Si cet outil a ses limites, il a le mérite d’exister et il préfigure ceux des années suivantes, développés entre autres par Systran, Alis Technologies, Globalink ou Lernout & Hauspie.

= De l'ASCII à l'Unicode

Communiquer dans plusieurs langues implique d’avoir des systèmes de codage adaptés à nos alphabets ou idéogrammes respectifs.