Au début des années 2000, des dictionnaires bilingues et multilingues de qualité sont progressivement mis en ligne par des organismes de renom, par exemple la base Eurodicautom de la Commission européenne, ou encore Le Signet et le Grand dictionnaire terminologique (GDT) de l’Office québécois de la langue française (OQLF), tous trois en accès libre et gratuit.
Géré par le service de traduction de la Commission européenne, Eurodicautom est un dictionnaire multilingue de termes économiques, scientifiques, techniques et juridiques, avec une moyenne de 120.000 consultations quotidiennes. Il permet de combiner entre elles les onze langues officielles de l’Union européenne (allemand, anglais, danois, espagnol, finnois, français, grec, hollandais, italien, portugais, suédois), ainsi que le latin. Fin 2003, Eurodicautom annonce son intégration dans une base terminologique plus vaste regroupant les bases de plusieurs institutions de l’Union européenne. Cette nouvelle base traiterait non plus douze langues, mais une vingtaine, puisque l’Union européenne s’élargit à l’Est et passe de 15 à 25 membres en mai 2004, pour atteindre 27 membres en janvier 2007. Cette base terminologique voit le jour en mars 2007, sous le nom de IATE (Inter-Active Terminology for Europe), avec 1,4 million d’entrées dans 24 langues.
Géré par l’Office québécois de la langue française (OQLF), Le Signet propose 10.000 fiches bilingues français-anglais dans le domaine des technologies de l’information. Quant au Grand dictionnaire terminologique (GDT), il est mis en ligne en septembre 2000. Il s’agit d’un vaste dictionnaire bilingue français-anglais de 3 millions de termes du vocabulaire industriel, scientifique et commercial, qui représente l’équivalent de 3.000 ouvrages de référence imprimés. Sa mise en ligne est le résultat d’un partenariat entre l’OQLF, auteur du dictionnaire, et Semantix, société spécialisée dans les solutions logicielles linguistiques. Evénement célébré par de nombreux linguistes, cette mise en ligne est un succès. Dès le premier mois, le GDT est consulté par 1,3 million de personnes, avec des pointes de 60.000 requêtes quotidiennes. La gestion de la base est ensuite assurée par Convera Canada. En février 2003, les requêtes sont au nombre de 3,5 millions par mois. Une nouvelle version du GDT est mise en ligne en mars 2003. Sa gestion est désormais assurée par l’OQLF lui-même, et non plus par une société prestataire.
Par ailleurs, des moteurs spécifiques permettent la recherche simultanée dans plusieurs centaines de dictionnaires. Pour ne prendre qu’un exemple, le site OneLook, créé par Robert Ware, puise dans près de 9 millions de termes provenant de 936 dictionnaires généralistes et spécialisés (chiffres d’avril 2007).
Des équipes de linguistes gèrent aussi des répertoires de dictionnaires, par exemple Dictionnaires électroniques et yourDictionary.com.
Maintenu par la section française des services linguistiques centraux de la Chancellerie fédérale suisse, Dictionnaires électroniques est un excellent répertoire de dictionnaires monolingues (français, allemand, italien, anglais, espagnol), bilingues et multilingues en accès libre sur le web. Ce répertoire est complété par des listes d’abréviations et d'acronymes et par des répertoires géographiques, essentiellement des atlas. Marcel Grangier, responsable de la section française des services linguistiques, précise en janvier 2000: «Les Dictionnaires électroniques ne sont qu’une partie de l’ensemble, et d’autres secteurs documentaires ont trait à l’administration, au droit, à la langue française, etc., sans parler des informations générales. (…) Conçu d’abord comme un service intranet, notre site web se veut en premier lieu au service des traducteurs opérant en Suisse, qui souvent travaillent sur la même matière que les traducteurs de l’Administration fédérale, mais également, par certaines rubriques, au service de n’importe quel autre traducteur où qu’il se trouve. (…) Travailler sans internet est devenu tout simplement impossible. Au-delà de tous les outils et commodités utilisés (messagerie électronique, consultation de la presse électronique, activités de services au profit de la profession des traducteurs), internet reste pour nous une source indispensable et inépuisable d’informations dans ce que j’appellerais le "secteur non structuré" de la toile. Pour illustrer le propos, lorsqu’aucun site comportant de l’information organisée ne fournit de réponse à un problème de traduction, les moteurs de recherche permettent dans la plupart des cas de retrouver le chaînon manquant quelque part sur le réseau.»
Réputé lui aussi pour sa qualité, yourDictionary.com est cofondé par Robert Beard en 1999, dans le prolongement de son ancien site - A Web of Online Dictionaries - créé dès 1995. En septembre 2003, yourDictionary.com répertorie plus de 1.800 dictionnaires dans 250 langues, ainsi que de nombreux outils linguistiques: vocabulaires, grammaires, glossaires, méthodes de langues, etc. En avril 2007, le répertoire comprend 2.500 dictionnaires et grammaires dans 300 langues. Soucieux de servir toutes les langues sans exception, le site propose une section spécifique - Endangered Language Repository - consacrée aux langues menacées d’extinction.
Publiée par SIL International (SIL: Summer Institute of Linguistics), l’encyclopédie Ethnologue : Languages of the World existe à la fois en version web (gratuite), sur CD-Rom (payant) et en version imprimée (payante). Barbara Grimes, sa directrice de publication entre 1971 et 2000 (8e-14e éditions), relate en janvier 2000: «Il s’agit d’un catalogue des langues dans le monde, avec des informations sur les endroits où elles sont parlées, une estimation du nombre de personnes qui les parlent, la famille linguistique à laquelle elles appartiennent, les autres termes utilisés pour ces langues, les noms de dialectes, d’autres informations socio-linguistiques et démographiques, les dates des Bibles publiées, un index des noms de langues, un index des familles linguistiques et des cartes géographiques relatives aux langues.» En avril 2007, cette encyclopédie répertorie 6.912 langues selon plusieurs critères (pays, nom de la langue, code de la langue attribué par le SIL, famille de langues), avec moteur de recherche.
= Annuaires et portails
Le premier annuaire internet francophone est lancé par l’UREC (Unité réseaux du CNRS). Créé dès janvier 1994, cet annuaire recense d’abord les sites académiques avant d’offrir un contenu plus généraliste. Il permet aux usagers francophones de se familiariser avec le web sans se noyer dans la masse d’informations mondiale. Trois ans plus tard, la gestion de l’annuaire devient difficile du fait du nombre exponentiel de sites web, notamment de sites commerciaux. De plus, d'autres annuaires voient le jour dans l'intervalle, dont certains débutés avec l’aide de l’UREC. En juillet 1997, considérant que sa mission est accomplie, l’UREC arrête la mise à jour de cet annuaire généraliste. L’annuaire retourne à sa vocation première, à savoir un annuaire spécialisé consacré à l’enseignement supérieur et la recherche.