= Une œuvre de longue haleine
Contrairement à ce que certains croient, cette vaste entreprise n'est née ni avec l'internet (1974) ni avec le web (1993), même si sa version web a beaucoup contribué à la faire connaître. Il s'agit d'un projet de recherche actif depuis plus de cinquante ans.
L'Ethnologue est fondé en 1951 par Richard Pittman, qui est le directeur de publication des sept premières éditions, de 1951 à 1969. À l'origine, son but est de partager les informations glanées sur les langues minoritaires avec ses collègues de SIL International et d'autres linguistes. L'Ethnologue débute comme un catalogue de langues minoritaires avant de prendre de l'ampleur au fil des ans.
Barbara Grimes est la directrice de publication des sept éditions suivantes, de la 8e à la 14e, entre 1971 à 2000. À partir de 1971, le champ des informations s'élargit pour ne plus concerner seulement les langues minoritaires, mais pour englober aussi peu à peu toutes les langues vivantes connues dans le monde. Entre 1967 et 1973, Barbara Grimes révise d'abord en profondeur toutes les informations disponibles sur les langues d'Afrique, des Amériques, du Pacifique et de quelques pays d'Asie. Pendant ses années comme directrice de publication, entre 1971 et 2000, le nombre de langues recensées passe de 4.493 à 6.809, et les informations disponibles pour chaque langue sont elles-mêmes plus complètes, si bien que l'encyclopédie triple de taille.
En 2000, Raymond Gordon Jr. devient le troisième directeur de publication de l'Ethnologue et produit la 15e édition (2005). Il cède ensuite la place à Paul Lewis, aidé de Conrad Hurd pour la gestion de la base de données et de Raymond Gordon pour la direction des équipes nationales et linguistiques sur le terrain.
Dans l'introduction de la 16e édition (2009), on peut lire ceci : «La manière dont chacun choisit de définir une langue dépend des motifs qu'on a d'identifier cette langue comme étant distincte d'une autre. Certains basent la définition d'une langue sur des raisons purement linguistiques. D'autres reconnaissent la nécessité de prendre également en compte des facteurs sociaux, culturels ou politiques. En outre, les locuteurs d'une langue donnée ont souvent leurs propres critères sur l'appropriation d'une langue comme étant la leur. Ces critères sont souvent bien davantage liés à des questions de patrimoine et d'identité qu'aux traits linguistiques de la langue ou des langues en question.»
= La codification des langues
Comme expliqué dans l'introduction de la 16e édition (2009), une caractéristique de la base de données de l'Ethnologue est un système de codification des langues au moyen de trois lettres (par exemple FRA pour la France), ce depuis sa création. Cette codification est incluse dans l'encyclopédie elle-même à partir de la 10e édition (1984).
L'Organisation internationale de normalisation (ISO) adopte pour sa part la norme ISO 639-2 en 1998. Cette norme, qui codifie également chaque langue au moyen de trois lettres, est une convergence de la norme ISO 639-1 (un ancien standard de deux lettres pour chaque langue, adopté en 1988) et de la norme ANSI Z39.53 (les codes de langues MARC, trois lettres pour chaque langue, développés par les bibliothèques américaines et adoptés en tant que norme nationale en 1987).
La norme ISO 639-2 (1998) devient vite insuffisante puisqu'elle codifie moins de 400 langues individuelles. En 2002, l'ISO invite donc SIL International à établir une nouvelle norme permettant d'harmoniser les codes utilisés dans l'Ethnologue avec les codes de la norme ISO, en y intégrant aussi les codes des langues mortes utilisés par la Linguist List, une grande liste de diffusion à destination des linguistes.