Publiée en 2007, la norme ISO 639-3 attribue un identifiant de trois lettres à 7 589 langues, par exemple « fra » pour le français.
Cette norme existe depuis plus de trente ans. La première norme en vigueur est la norme ISO 639-1, adoptée par l’Organisation internationale de normalisation (ISO) en 1988 et qui identifie chaque langue sur deux lettres.
Dix ans plus tard suit la norme ISO 639-2, adoptée en 1998 et qui identifie cette fois chaque langue au moyen de trois lettres mais se limite à 400 langues. Cette norme est la convergence de la norme ISO 639-1 avec la norme ANSI Z39.53 (ANSI : American National Standards Institute). La norme ANSI correspond aux codes de langues MARC (Machine Readable Cataloging), des identifiants sur trois lettres développés par les bibliothèques américaines et adoptés en tant que norme nationale en 1987.
Par ailleurs, un autre effort de codification est poursuivi par l’Ethnologue, magnifique catalogue encyclopédique de langues vivantes publié depuis 1950 par SIL International, avec une nouvelle version tous les quatre ans. L’équipe de l’Ethnologue a elle aussi créé des codes de trois lettres pour chaque langue dans sa base de données, ce depuis 1971, avec inclusion des codes dans l'encyclopédie elle-même à partir de la 10e édition (1984).
Revenons à la norme ISO 639-2, qui devient vite insuffisante du fait du petit nombre de langues pris en compte. En 2002, l'ISO invite donc SIL International à établir une nouvelle norme qui harmoniserait les identifiants utilisés par l'Ethnologue avec les identifiants de la norme ISO 639-2, en y intégrant aussi les codes des langues mortes utilisés par la Linguist List, grande liste de diffusion à destination des linguistes.
Le résultat, officiellement approuvé en 2006 et publié en 2007, est la norme ISO 639-3, qui attribue un code de trois lettres à 7 589 langues, avec un travail aussi exhaustif que possible puisque cette liste de codes inclut les langues vivantes ou mortes, anciennes ou artificielles, importantes ou minoritaires, écrites ou non écrites.
SIL International est également désigné comme l'organisme responsable de l'enregistrement de nouvelles langues pour l'ISO 639-3, et gère donc le cycle annuel des modifications et des mises à jour. Au 21e siècle, la préservation des langues passe par leur codification.
2007 > GOOGLE TRADUCTION
[Résumé] Lancé par Google en octobre 2007, Google Traduction est un service en ligne gratuit qui traduit instantanément un texte ou une page web dans une autre langue. Les usagers copient un texte dans l’interface web ou entrent une adresse web. Le service de traduction automatique de Google se base sur une analyse statistique et non sur une analyse traditionnelle basée sur des règles. Avant cette date, Google utilisait un traducteur de Systran du même type que Babel Fish dans Yahoo! Comme tout outil de traduction automatique, Google Traduction peut aider l’usager à comprendre le sens général d’un texte en langue étrangère, mais ne propose pas de traductions exactes. En 2009, le texte peut être lu par synthèse vocale, avec l’ajout de nouvelles langues au fil des mois. Disponible en juin 2009, Google Translator Toolkit est un service web permettant aux traducteurs de réviser les traductions générées automatiquement par Google Traduction.
***