# UNDL Foundation
Développé sous l'égide de l'UNU/IAS (United Nations University/Institute of Advanced Studies - Université des Nations Unies/ Institut des études avancées) à Tokyo (Japon), l'UNL (universal networking language - langage d'interconnexion universel) est un projet de métalangage numérique pour l'encodage, le stockage, la recherche et la communication d'informations multilingues indépendamment d'une langue-source donnée, et donc d'un système de pensée donné. Ce métalangage est développé à partir de janvier 1997 au sein de l'UNL Program, un programme international impliquant de nombreux partenaires dans toutes les communautés linguistiques. En 1998, 120 chercheurs de par le monde travaillent sur un projet multilingue comportant 17 langues (allemand, anglais, arabe, brésilien, chinois, espagnol, français, hindou, indonésien, italien, japonais, letton, mongolien, russe, swahili et thaï). Ce programme se poursuit ensuite sous l'égide de l'UNDL Foundation (UNDL: Universal Networking Digital Language - Langage numérique d'interconnexion universel), fondée en janvier 2001.
Christian Boitet, directeur du Groupe d'étude pour la traduction automatique (GETA) à Grenoble, un des nombreux participants de l'UNL Program, explique en septembre 1998 en quoi consiste le projet: "Il s'agit non de TAO [traduction assistée par ordinateur] habituelle, mais de communication et recherche d'information multilingue. 14 groupes ont commencé le travail sur 12 langues (plus 2 annexes) depuis début 1997. L'idée est de développer un standard, dit UNL [universal networking language], qui serait le HTML du contenu linguistique, et pour chaque langue, de développer un générateur (dit 'déconvertisseur') accessible sur un ou plusieurs serveurs, et un 'enconvertisseur'. L'UNU [Université des Nations Unies] finance 50% du coût. D'après notre évaluation sur la première année, c'est plutôt 30 à 35%, car le travail (linguistique et informatique) est énorme, et le projet passionnant: les permanents des laboratoires s'y investissent plus que prévu. (…)
La déconversion tourne pour le japonais, le chinois, l'anglais, le portugais, l'indonésien, et commence à tourner pour le français, l'allemand, le russe, l'italien, l'espagnol, l'hindi, l'arabe et le mongol. Chaque langue a une base lexicale de 30.000 à 120.000 liens UW [universal word]—lexème. L'enconversion n'est pas (si on veut de la qualité pour du tout venant) une analyse classique. C'est une méthode de fabrication de graphes UNL [universal networking language] qui suppose une bonne part d'interaction, avec plusieurs possibilités: (a) analyse classique multiple suivie d'une désambiguïsation interactive en langue source, (b) entrée sous langage contrôlé, (c) encore plus séduisant (et encore pas clair, au niveau recherche pour l'instant), entrée directe via une interface graphique reliée à la base lexicale et à la base de connaissances. Les applications possibles sont le courriel multilingue, les informations multilingues, les dictionnaires actifs pour la lecture de langues étrangères sur le web, et bien sûr la TA [traduction automatique] de mauvaise qualité (ce qu'on trouve actuellement, mais pour tous les couples à cause de l'architecture à pivot) pour le surf web et la veille. On travaille actuellement sur les informations sportives sur le web, surtout sur le foot. On construit une base de documents, où chaque fichier est structuré (à la HTML) et contient, pour chaque énoncé, l'énoncé original, sa structure UNL, et autant de traductions qu'on en a obtenu. Un tel document peut être recherché dans une base en traduisant la question en UNL, puis affiché (le UNL viewer existe depuis un an) dans autant de fenêtres d'un brauser web que de langues sélectionnées."
En ce qui concerne les perspectives, "le projet a un problème de volume: grande surface, pas assez d'épaisseur. Il faudrait trois à cinq fois plus de monde partout pour que ça avance assez vite (pour que Microsoft et d'autres ne finissent pas par tout reprendre et revendre, alors qu'on vise une utilisation ouverte, du type de ce qu'on fait avec les serveurs et clients web). Les subventions des sociétés japonaises à l'UNU pour ce projet (et d'autres) se tarissent à cause de la crise japonaise. Le groupe central est beaucoup trop petit (quatre personnes qui font le logiciel, le japonais, l'anglais, l'administration, c'est peu même avec de la sous-traitance). De plus, le plan général est d'ouvrir aux autres langues de l'ONU en 2000. Il faudrait arriver à un état satisfaisant pour les treize autres avant. Du point de vue politique et culturel, ce projet est très important, en ce qu'il montre pour la première fois une voie possible pour construire divers outils soutenant l'usage de toutes les langues sur internet, qu'elles soient majoritaires ou minoritaires. En particulier, ce devrait être un projet majeur pour la francophonie. Dans l'état actuel des choses, je pense que l'élan initial a été donné, mais que la première phase (d'ici 2000) risque de retomber comme un soufflé si on ne consolide pas très vite le projet, dans chaque pays participant. Donc l'UNU cherche comment monter un soutien puissant à la mesure de cette ambition. Je pense que, pour la francophonie par exemple, il faudrait un groupe d'une dizaine de personnes ne se consacrant qu'à ce projet pendant au moins dix ans, plus des stagiaires et des collaborateurs sur le réseau, bénévoles ou intéressés par la mise à disposition gratuite de ressources et d'outils."
CHRONOLOGIE
[Chaque ligne débute par l'année ou bien l'année/mois. Par exemple, 1971/07 signifie juillet 1971.]
1968: Le code ASCII est le premier système d'encodage informatique.
1971/07: Le Projet Gutenberg est la première bibliothèque numérique.
1974: L'internet fait ses débuts.
1990: Le web est inventé par Tim Berners-Lee.
1991/01: L'Unicode est un système d'encodage pour toutes les langues.
1993/11: Mosaic est le premier logiciel de navigation sur le web.
1994/04: La Human-Languages Page est un catalogue des ressources linguistiques sur le web.
1994/10: Le World Wide Web Consortium offrira des outils pour un web multilingue.
1994: Travlang est un site consacré aux languages et aux voyages.
1995/12: La Kotoba Home Page explique comment utiliser son clavier dans plusieurs langues.
1995: L'Internet Dictionary Project veut créer des dictionnaires de traduction gratuits.
1995: NetGlos est un glossaire multilingue pour la terminologie de l'internet.
1995: Global Reach est une société de conseil émanant de Euro-Marketing Associates.
1995: L'association LISA développe des standards pour l'industrie de la localisation.
1995: L'Ethnologue, encyclopédie des langues, est disponible gratuitement sur le web.
1996/04: OneLook Dictionaries offre un point commun pour de nombreux dictionnaires en ligne.
1997/01: L'UNL (universal networking language) est un projet de métalangage numérique.
1997/12: AltaVista lance AltaVista Translation, appelé aussi Babel Fish.
1997: Le Logos Dictionary est mis en ligne gratuitement.
1999/12: WebEncyclo est la première encyclopédie francophone en accès libre.
1999/12: Britannica.com est la première encyclopédie anglophone en accès libre.
1999: WordReference.com propose des dictionnaires bilingues gratuits en ligne.
2000/02: yourDictionary.com est un portail pour les langues.
2000/07: La moitié des usagers de l'internet est non anglophone.
2000/09: Le Grand dictionnaire terminologique (GDT) est bilingue français-anglais.
2001/01: Wikipédia est la première grande encyclopédie collaborative multilingue.
2001/01: L'UNL est désormais développé au sein de l'UNDL Foundation.
2001/04: La Human-Languages Page devient le portail iLoveLanguages.
2004/01: Le Projet Gutenberg Europe est lancé en tant que projet multilingue.
2007/03: IATE (Inter-Active Terminology for Europe) est la nouvelle base terminologique européenne.
2009: L'Ethnologue sort une nouvelle édition (16e éd.), qui recense 6.909 langues.
SITES WEB
Alis Technologies: http://www.alis.com/
Aquarius.net: Directory of Localization Experts: http://www.aquarius.net/
ASCII Table: http://www.asciitable.com/
Asia-Pacific Association for Machine Translation (AAMT): http://www.aamt.info/
Association for Computational Linguistics (ACL): http://www.aclweb.org/
Association for Machine Translation in the Americas (AMTA): http://www.amtaweb.org/
CALL@Hull: http://www.fredriley.org.uk/call/
ELRA (European Language Resources Association): http://www.elra.info/
ELSNET (European Network of Excellence in Human Language Technologies): http://www.elsnet.org/
Encyclopaedia Britannica Online: http://www.britannica.com/
Encyclopaedia Universalis: http://www.universalis-edu.com/
Ethnologue: http://www.ethnologue.com/
Ethnologue: Endangered Languages: http://www.ethnologue.com/nearly_extinct.asp
EUROCALL (European Association for Computer-Assisted Language Learning): http://www.eurocall-languages.org/
European Association for Machine Translation (EAMT): http://www.eamt.org/
European Bureau for Lesser-Used Languages (EBLUL): http://www.eblul.org/
European Commission: Languages of Europe: http://ec.europa.eu/education/languages/languages-of-europe/
European Minority Languages (liste de l'Institut Sabhal Mòr Ostaig): http://www.smo.uhi.ac.uk/saoghal/mion-chanain/en/
Google Translate: http://translate.google.com/
Grand dictionnaire terminologique (GDT): http://www.granddictionnaire.com/
IATE: InterActive Terminology for Europe: http://iate.europa.eu/
ILOTERM (ILO: International Labor Organization): http://www.ilo.org/iloterm/
iLoveLanguages: http://www.ilovelanguages.com/
International Committe on Computational Linguistics (ICCL): http://nlp.shef.ac.uk/iccl/
Internet Dictionary Project (IDP): http://www.june29.com/IDP/
Internet Society (ISOC): http://www.isoc.org/
Laboratoire CLIPS (Communication langagière et interaction personne-système): http://www-clips.imag.fr/
Laboratoire CLIPS: GETA (Groupe d'étude pour la traduction automatique): http://www-clips.imag.fr/geta/
LINGUIST List (The): http://linguistlist.org/
Localization Industry Standards Association (LISA): http://www.lisa.org/
Logos: Multilingual Translation Portal: http://www.logos.it/
MAITS (Multilingual Application Interface for Telematic Services): http://wwwold.dkuug.dk/maits/
Merriam-Webster Online: http://www.merriam-webster.com/
Natural Language Group (NLG) at USC/ISI: http://www.isi.edu/natural-language/
Nuance: http://www.nuance.com/
OneLook Dictionary Search: http://www.onelook.com/
Oxford English Dictionary (OED): http://www.oed.com/
Oxford Reference Online (ORO): http://www.oxfordreference.com/
PAHOMTS (PAHO: Pan American Health Organization): http://www.paho.org/english/am/gsp/tr/machine_trans.htm
Palo Alto Research Center (PARC): http://www.parc.com/
Palo Alto Research Center (PARC): Natural Language Processing: http://www.parc.com/work/focus-area/NLP/
RALI (Recherche appliquée en linguistique informatique): http://www-rali.iro.umontreal.ca/
Reverso: Free Online Translator: http://www.reverso.net/
SDL: http://www.sdl.com/
SDL: FreeTranslation.com: http://www.freetranslation.com/
SDL Trados: http://www.trados.com/
Softissimo: http://www.softissimo.com/
SYSTRAN: http://www.systranlinks.com/
SYSTRANet: Free Online Translator: http://www.systranet.com/
TEI: Text Encoding Initiative: http://www.tei-c.org/index.xml
TERMITE (Terminology of Telecommunications): http://www.itu.int/terminology/index.html
*tmx Vokabeltrainer: http://www.tmx.de/
Transparent Language: http://www.transparent.com/
TransPerfect: http://www.transperfect.com/
Travlang: http://www.travlang.com/
Travlang's Translating Dictionaries: http://dictionaries.travlang.com/
UNDL (Universal Networking Digital Language) Foundation: http://www.undl.org/
Unicode: http://www.unicode.org/
Yahoo! Babel Fish: http://babelfish.yahoo.com/
YourDictionary.com: http://www.yourdictionary.com/
YourDictionary.com: Endangered Languages: http://www.yourdictionary.com/elr/index.html
W3C: World Wide Web Consortium: http://www.w3.org/
W3C Internationalization Activity: http://www.w3.org/International/
WELL (Web Enhanced Language Learning): http://www.well.ac.uk/
Wordfast: http://www.wordfast.org/
Xerox XRCE (Xerox Research Centre Europe): http://www.xrce.xerox.com/
Xerox XRCE: Cross-Language Technologies: http://www.xrce.xerox.com/competencies/cross-language/