Une nouvelle étape s’ouvre avec les débuts de Citizendium (qui se veut l’abrégé de: The Citizens’ Compendium), une grande encyclopédie collaborative en ligne conçue en novembre 2006 et lancée en mars 2007 (version bêta) par Larry Sanger, co-fondateur de Wikipedia, mais qui quitte ensuite l’équipe de Wikipedia suite à des problèmes de qualité de contenu. Citizendium est basé sur le même modèle que Wikipedia (collaborative et gratuite) tout en évitant ses travers (vandalisme et manque de rigueur). Les auteurs signent les articles de leur vrai nom et les articles sont édités par des experts («editors») titulaires d'une licence universitaire et âgés d'au moins 25 ans. De plus, des «constables» sont chargés de la bonne marche du projet et du respect du règlement. Le jour de son lancement (25 mars 2007), Citizendium comprend 820 auteurs et 180 experts.
Dans Why Make Room for Experts in Web 2.0?, une communication datée d’octobre 2006, Larry Sanger voit dans Citizendium l’émergence d’un nouveau modèle de collaboration massive de dizaines de milliers d’intellectuels et scientifiques, non seulement pour les encyclopédies, mais aussi pour les manuels d’enseignement, les ouvrages de référence, le multimédia et les applications en 3D. Cette collaboration est basée sur le partage des connaissances, dans la lignée du web 2.0, un concept lancé en 2004 pour caractériser les notions de communauté et de partage et qui se manifeste d’abord par une floraison de wikis, de blogs et de sites sociaux. D’après Larry Sanger, il importe maintenant de créer des structures permettant des collaborations scientifiques et Citizendium pourrait servir de prototype dans ce domaine.
Un appel qui semble déjà se concrétiser avec l’Encyclopedia of Life, nouveau «compendium» dont le projet débute en mai 2007. Cette vaste encyclopédie collaborative en ligne rassemblera les connaissances sur toutes les espèces animales et végétales connues (1,8 million), y compris les espèces en voie d’extinction, avec l’ajout de nouvelles espèces au fur et à mesure de leur identification (il en existerait de 8 à 10 millions). Il s’agira d’une encyclopédie multimédia permettant de ressembler textes, photos, cartes, bandes sonores et vidéos, avec une page web par espèce, et permettant aussi d’offrir un portail unique à des millions de documents épars, en ligne et hors ligne. Outil d’apprentissage et d’enseignement pour une meilleure connaissance de notre planète, cette encyclopédie sera à destination de tous: scientifiques, enseignants, étudiants, scolaires, médias, décideurs et grand public.
Ce projet collaboratif est mené par plusieurs grandes institutions (Field Museum of Natural History, Harvard University, Marine Biological Laboratory, Missouri Botanical Garden, Smithsonian Institution, Biodiversity Heritage Library). Son directeur honoraire est Edward Wilson, professeur émérite à l’Université de Harvard, qui, dans un essai daté de 2002, est le premier à émettre le voeu d’une telle encyclopédie. Cinq ans après, en 2007, c'est chose désormais possible grâce aux avancées technologiques de ces dernières années, notamment les outils logiciels permettant l’agrégation de contenu, le mash-up (à savoir le fait de rassembler un contenu donné à partir de très nombreuses sources différentes), les wikis de grande taille et la gestion de contenu à vaste échelle. Consortium des dix plus grandes bibliothèques des sciences de la vie (d’autres suivront), la Biodiversity Heritage Library a d’ores et déjà débuté la numérisation de 2 millions de documents, dont les dates de publication s’étalent sur 200 ans. En mai 2007, date du lancement officiel du projet, on compte déjà 1,25 million de pages traitées dans les centres de numérisation de Londres, Boston et Washington DC, et disponibles sur le site de l’Internet Archive.
Le financement initial est assuré par la MacArthur Foundation (10 millions de dollars) et la Sloan Foundation (2,5 millions de dollars). 100 millions de dollars US sont nécessaires pour un financement sur dix ans, avant que l'encyclopédie ne puisse s'autofinancer. La réalisation des pages web débute courant 2007. L’encyclopédie fait ses débuts à la mi-2008. Opérationnelle d'ici trois à cinq ans, elle devrait être complète - c'est-à-dire à jour - dans dix ans.
Dans la lignée du Human Genome Project (Séquencage du génome humain), publié pour la première fois en février 2001 et appartenant d'emblée au domaine public, l’Encyclopedia of Life permettra non seulement de rassembler toutes les connaissances disponibles à ce jour sur les espèces animales et végétales, mais elle sera aussi un «macroscope» permettant de déceler les grandes tendances à partir d’un stock considérable d’informations, à la différence du microscope qui permet l’étude du détail. En plus de sa flexibilité et de sa diversité, elle permettra à chacun de contribuer au contenu sous une forme s’apparentant au wiki, ce contenu étant ensuite validé ou non par des scientifiques. La version initiale sera d’abord en anglais avant d’être traduite en plusieurs langues par de futurs organismes partenaires.
= Dictionnaires de langues
Des dictionnaires de langues sont en accès libre dès les débuts du web. Souvent sommaires et de qualité inégale, ils sont répertoriés dans Travlang, un site consacré aux voyages et aux langues créé en 1994 par Michael M. Martin.
Fondé en 1979 à Modène (Italie) par Rodrigo Vergara, Logos est une société de traduction offrant des services dans 35 langues en 1997, avec un réseau de 300 traducteurs dans le monde. Initiative peu courante à l’époque, Logos décide de mettre tous ses outils professionnels en accès libre sur le web. Dans un entretien publié dans le quotidien Le Monde du 7 décembre 1997, Rodrigo Vergara relate: «Nous voulions que nos traducteurs aient tous accès aux mêmes outils de traduction. Nous les avons donc mis à leur disposition sur internet, et tant qu’à faire nous avons ouvert le site au public. Cela nous a rendus très populaires, nous a fait beaucoup de publicité. L’opération a drainé vers nous de nombreux clients, mais aussi nous a permis d’étoffer notre réseau de traducteurs grâce aux contacts établis à la suite de cette initiative.»
Les outils de traduction disponibles sur le web comprennent un dictionnaire multilingue de 7,5 millions d’entrées (Logos Dictionary), une base de données de 553 glossaires (Linguistic Resources), des tables de conjugaison en 17 langues (Conjugation of Verbs), et enfin la Wordtheque, une base de données multilingue de 328 millions de termes issus de traductions de romans et de documents techniques. La recherche dans la Wordtheque est possible par langue, mot, auteur ou titre. En 2007, la Wordtheque, devenue la Logos Library, comprend 710 millions de termes. Conjugation of Verbs, devenu l’Universal Conjugator, propose des tableaux de conjugaison dans 36 langues. Linguistic Resources offre un point d’accès unique pour 1 215 glossaires.