Le Livre 010101, Tome 2 (1998-2003) - Marie Lebert

Il importe en effet d’avoir à l’esprit l’ensemble des langues et pas seulement les langues dominantes, comme le souligne en février 2001 Pierre-Noël Favennec, expert à la direction scientifique de France Télécom R&D: "Les recherches sur la traduction automatique devraient permettre une traduction automatique dans les langues souhaitées, mais avec des applications pour toutes les langues et non les seules dominantes (ex.: diffusion de documents en japonais, si l’émetteur est de langue japonaise, et lecture en breton, si le récepteur est de langue bretonne…). Il y a donc beaucoup de travaux à faire dans le domaine de la traduction automatique et écrite de toutes les langues."

= La traduction automatique

Il va sans dire que la traduction automatique n’offre pas la qualité de travail des professionnels de la traduction, et qu’il est très préférable de faire appel à ces derniers quand on a le temps et l’argent nécessaires. Les logiciels de traduction sont toutefois très pratiques pour fournir un résultat immédiat et à moindres frais, sinon gratuit. Des logiciels en accès libre sur l’internet permettent de traduire en quelques secondes une page web ou un texte court, avec plusieurs combinaisons de langues possibles.

Le but d’un logiciel de traduction automatique est d’analyser le texte dans la langue source (texte à traduire) et de générer automatiquement le texte correspondant dans la langue cible (texte traduit), en utilisant des règles précises pour le transfert de la structure grammaticale. Comme l’explique l’EAMT (European Association for Machine Translation) sur son site, "il existe aujourd’hui un certain nombre de systèmes produisant un résultat qui, s’il n’est pas parfait, est de qualité suffisante pour être utile dans certaines applications spécifiques, en général dans le domaine de la documentation technique. De plus, les logiciels de traduction, qui sont essentiellement destinés à aider le traducteur humain à produire des traductions, jouissent d’une popularité croissante auprès des organismes professionnels de traduction."

En 1998, un historique de la traduction automatique était présent sur le site de Globalink, société spécialisée dans les produits et services de traduction. Le site a depuis disparu, Globalink ayant été racheté en 1999 par Lernout & Hauspie (lui-même racheté en 2002 par ScanSoft). Voici cet historique résumé dans les deux paragraphes qui suivent.

La traduction automatique et le traitement de la langue naturelle font leur apparition à la fin des années 1930, et progressent ensuite de pair avec l’évolution de l’informatique quantitative. Pendant la deuxième guerre mondiale, le développement des premiers ordinateurs programmables bénéficie des progrès de la cryptographie et des efforts faits pour tenter de fissurer les codes secrets allemands et autres codes de guerre. Suite à la guerre, dans le secteur émergent des technologies de l’information, on continue de s’intéresser de près à la traduction et à l’analyse du texte en langue naturelle. Dans les années 1950, la recherche porte sur la traduction littérale, à savoir la traduction mot à mot sans prise en compte des règles linguistiques. Le projet russe débuté en 1950 à l’Université de Georgetown représente la première tentative systématique visant à créer un système de traduction automatique utilisable. Tout au long des années 1950 et au début des années 1960, des recherches sont également menées en Europe et aux Etats-Unis. En 1965, les progrès rapides en linguistique théorique culminent avec la publication d’Aspects de la théorie syntaxique, de Noam Chomsky, qui propose de nouvelles définitions de la phonologie, la morphologie, la syntaxe et la sémantique du langage humain. Toutefois, en 1966, un rapport officiel américain donne une estimation prématurément négative des systèmes de traduction automatique, mettant fin au financement et à l’expérimentation dans ce domaine pour la décennie suivante.

Il faut attendre la fin des années 1970 pour que des expériences sérieuses soient à nouveau entreprises, parallèlement aux progrès de l’informatique et des technologies des langues. Cette période voit aussi le développement de systèmes de transfert d’une langue à l’autre et le lancement des premières tentatives commerciales. Des sociétés comme Systran et Metal sont persuadées de la viabilité et de l’utilité d’un tel marché. Elles mettent sur pied des produits et services de traduction automatique reliés à un serveur central. Mais les problèmes restent nombreux: des coûts élevés de développement, un énorme travail lexicographique, la difficulté de proposer de nouvelles combinaisons de langues, l’inaccessibilité de tels systèmes pour l’utilisateur moyen, et enfin la difficulté de passer à de nouveaux stades de développement.

En 1999 et 2000, la généralisation de l’internet et les débuts du commerce électronique provoquent la naissance d’un véritable marché. Trois sociétés – Systran, Softissimo et Lernout & Hauspie – lancent des produits à destination du grand public, des professionnels et des industriels.

Systran développe un logiciel de traduction utilisé notamment par le moteur de recherche AltaVista. Softissimo commercialise la série de logiciels de traduction Reverso, à côté de produits d’écriture multilingue, de dictionnaires électroniques et de méthodes de langues. Reverso équipe par exemple Voilà, le moteur de recherche de France Télécom. Lernout & Hauspie (racheté depuis par ScanSoft) propose des produits et services en dictée, traduction, compression vocale, synthèse vocale et documentation industrielle.

En mars 2001, IBM se lance à son tour dans un marché en pleine expansion. Il commercialise un produit professionnel haut de gamme, le WebSphere Translation Server. Ce logiciel traduit instantanément en plusieurs langues (allemand, anglais, chinois, coréen, espagnol, français, italien, japonais) des pages web, des courriers électroniques et des dialogues en direct (chats). Il interprète 500 mots à la seconde et permet l’ajout de vocabulaires spécifiques.