= Le patrimoine linguistique en ligne
L'internet peut favoriser non seulement l'usage du français, en cas de volonté politique et culturelle dans ce sens, mais aussi la transmission du patrimoine linguistique. Un exemple parmi d'autres est celui des dictionnaires anciens, qui trouvent une nouvelle vie grâce au web.
Dès 1996, le site de l'Institut national de la langue française (InaLF) offre des ressources terminologiques sur le discours littéraire des 14e au 20e siècles (contenu, sémantique, thématique), sur la langue courante (langue écrite, langue parlée, argot) et sur le discours scientifique et technique.
Christiane Jadelot, ingénieur d'études à l'INaLF-Nancy, explique en juin 1998: «Les premières pages sur l'INaLF ont été mises sur l'internet au milieu de l'année 1996, à la demande de Robert Martin, directeur de l'INaLF. J'ai participé à la mise sous internet de ces pages (…). La direction a senti la nécessité urgente de nous faire connaître par l'internet, que beaucoup d'autres entreprises utilisaient déjà pour promouvoir leurs produits. Nous sommes en effet "Unité de recherche et de service" et nous avons donc à trouver des clients pour nos produits informatisés, le plus connu d'entre eux étant la base textuelle FRANTEXT [sur l'internet depuis début 1995, NDLR], ainsi qu'une maquette du tome 14 du TLF [Trésor de la langue française]. Il était donc nécessaire de faire connaître l'ensemble de l'INaLF par ce moyen. Cela correspondait à une demande générale.»
La base FRANTEXT comprend, en mode interactif, 180 millions de mots- occurrences provenant d'une collection représentative de 3.500 unités textuelles en arts, sciences et techniques des 16e-20e siècles. Début 1998, 82 centres de recherche et bibliothèques universitaires sont abonnés, en Europe, en Australie, au Japon et au Canada, ce qui représente 1.250 postes de travail ayant accès à la base, avec une cinquantaine de sessions d'interrogations par jour.
Le Projet ARTFL (ARTFL: American and French Research on the Treasury of the French Language) est un projet commun du Centre national de la recherche scientifique (CNRS, France) et de l'Université de Chicago (Illinois, États-Unis). À l'origine, ce projet a pour but de constituer une base de données de 2.000 textes des 13e-20e siècles ayant trait à la littérature, la philosophie, les arts et les sciences.
En 1998, l'ARTFL travaille à la version en ligne exhaustive de la première édition (1751-1772) de l'Encyclopédie ou Dictionnaire raisonné des sciences, des métiers et des arts de Diderot et d'Alembert. 72.000 articles rédigés par plus de 140 collaborateurs - dont Voltaire, Rousseau, d'Alembert, Marmontel, d'Holbach, Turgot, etc. - ont fait de cette encyclopédie un monumental ouvrage de référence pour les arts et les sciences. Destinée à rassembler puis divulguer les connaissances de l'époque, elle porte la marque des courants intellectuels et sociaux du 18e siècle, et c'est grâce à elle qu'ont été propagées les idées du Siècle des Lumières.
L'Encyclopédie comprend 17 volumes de texte - qui représentent 18.000 pages et 20.736.912 mots - et 11 volumes de planches.
La base de données correspondant au premier volume est accessible en ligne à titre expérimental. La recherche peut être effectuée par mot, portion de texte, auteur ou catégorie, ou par la combinaison de ces critères entre eux. On dispose de renvois d'un article à l'autre, au moyen de liens permettant d'aller d'une planche au texte ou du texte au fac-similé des pages originales. L'automatisation complète des procédures de saisie entraîne des erreurs typographiques et des erreurs d'identification qui sont ensuite corrigées au fil des mois. La recherche d'images par mot, portion de texte ou catégorie est également possible dans un deuxième temps.
L'ARTFL travaille aussi à un projet de base de données pour le Dictionnaire de l'Académie française, dont les différentes éditions se sont échelonnées entre 1694 et 1935. Ce projet inclut la saisie et l'édition du texte, ainsi que la création d'un moteur de recherche spécifique. La première édition (1694) et la cinquième édition (1798) du dictionnaire sont les premières à être disponibles pour une recherche par mot, puis pour une recherche en texte intégral. Les différentes éditions sont ensuite combinées dans une base de données unique, qui permet de juger de l'évolution d'un terme en consultant aussi bien une édition particulière que l'ensemble des éditions.