2002: LE WEB DEVIENT UNE VASTE ENCYCLOPEDIE

= [Résumé]

En 2002, le MIT (Massachusetts Institute of Technology) décide de publier le contenu de ses cours en ligne, avec accès libre et gratuit, en privilégiant la diffusion libre du savoir. Mise en ligne en septembre 2002, la version pilote du MIT OpenCourseWare (MIT OCW) offre en accès libre le matériel d’enseignement de 32 cours représentatifs des cinq facultés du MIT. Ce matériel d’enseignement comprend des textes de conférences, des travaux pratiques, des exercices et corrigés, des bibliographies, des documents audio et vidéo, etc. Parallèlement, la Public Library of Science (PLoS) met sur pied des revues scientifiques en ligne de haut niveau. En ce qui concerne les encyclopédies, Wikipédia ouvre la voie en 2001, en lançant une encyclopédie écrite collectivement et dont le contenu est librement réutilisable. Wikipédia est rédigé par des milliers de volontaires, avec possibilité de corriger et de compléter les articles, aussi bien les leurs que ceux d'autres contributeurs. Suivent d'autres encyclopédies comme Citizendium et l'Encyclopedia of Life.

= Vers un savoir numérique

Sur le site de l'Internet Society (ISOC), qu'il fonde en 1992 pour promouvoir le développement de l’internet, Vinton Cerf explique: «Le réseau fait deux choses (…): comme les livres, il permet d’accumuler de la connaissance. Mais, surtout, il la présente sous une forme qui la met en relation avec d’autres informations. Alors que, dans un livre, l’information est maintenue isolée.»

De plus, l’information contenue dans les livres reste la même, au moins pendant une période donnée, alors que l'internet privilégie l’information la plus récente et constamment actualisée.

Lors d'une conférence organisée par l'IFIP (International Federation of Information Processing) en septembre 1996, Dale Spender, professeur et chercheuse, tente de cerner les changements fondamentaux apportés par l'internet dans l'acquisition du savoir et les méthodes d'enseignement. Voici son argumentation résumée en deux paragraphes.

Pendant plus de cinq siècles, l'enseignement est principalement basé sur l'information donnée par les livres. Or les habitudes liées à l'imprimé ne peuvent être transférées au monde numérique. L'enseignement en ligne offre des possibilités tellement nouvelles qu'il n'est guère possible d'effectuer les distinctions traditionnelles entre enseignant et enseigné. Le passage de la culture imprimée à la culture numérique exige d'entièrement repenser le processus d'enseignement, puisque nous avons maintenant l'opportunité sans précédent de pouvoir influer sur le genre d'enseignement que nous souhaitons.

Dans la culture imprimée, l'information contenue dans les livres restait la même un certain temps, ce qui nous a encouragé à penser que l'information était stable. La nature même de l'imprimé est liée à la notion de vérité, stable elle aussi. Cette stabilité et l'ordre qu'elle engendre ont été un des fondements de l'âge industriel et de la révolution scientifique. Les notions de vérité, de lois, d'objectivité et de preuve ont été les éléments de référence de nos croyances et de nos cultures. Mais la révolution numérique change tout ceci. Soudain l'information en ligne supplante l'information imprimée pour devenir la plus fiable et la plus utile, et l'usager est prêt à la payer en conséquence. C'est cette transformation radicale dans la nature de l'information qui doit être au coeur du débat concernant les méthodes d'enseignement.

En témoigne l'expérience de Russon Wooldridge, professeur au département des études françaises de l'Université de Toronto (Canada), qui relate en février 2001: «Tout mon enseignement exploite au maximum les ressources d'internet (le web et le courriel): les deux lieux communs d'un cours sont la salle de classe et le site du cours, sur lequel je mets tous les matériaux des cours. Je mets toutes les données de mes recherches des vingt dernières années sur le web (réédition de livres, articles, textes intégraux de dictionnaires anciens en bases de données interactives, de traités du 16e siècle, etc.). Je publie des actes de colloques, j'édite un journal, je collabore avec des collègues français, mettant en ligne à Toronto ce qu'ils ne peuvent pas publier en ligne chez eux. En mai 2000 j'ai organisé à Toronto un colloque international sur "Les études françaises valorisées par les nouvelles technologies". (…)

Je me rends compte que sans internet mes activités seraient bien moindres, ou du moins très différentes de ce qu'elles sont actuellement. Donc je ne vois pas l'avenir sans. Mais il est crucial que ceux qui croient à la libre diffusion des connaissances veillent à ce que le savoir ne soit pas bouffé, pour être vendu, par les intérêts commerciaux. Ce qui se passe dans l'édition du livre en France, où on n'offre guère plus en librairie que des manuels scolaires ou pour concours (c'est ce qui s'est passé en linguistique, par exemple), doit être évité sur le web. Ce n'est pas vers les amazon.com qu'on se tourne pour trouver la science désintéressée. Sur mon site, je refuse toute sponsorisation.»

= Quelques projets pilotes

# Cours du MIT

Professeur à l’Université d’Ottawa (Canada), Christian Vandendorpe salue en mai 2001 «la décision du MIT (Massachusetts Institute of Technology) de placer tout le contenu de ses cours sur le web d’ici dix ans, en le mettant gratuitement à la disposition de tous. Entre les tendances à la privatisation du savoir et celles du partage et de l’ouverture à tous, je crois en fin de compte que c’est cette dernière qui va l’emporter.» Le MIT décide en effet de publier le contenu de ses cours en ligne, avec accès libre et gratuit, une initiative menée avec le soutien financier de la Hewlett Foundation et de la Mellon Foundation.

Mise en ligne en septembre 2002, la version pilote du MIT OpenCourseWare (MIT OCW) offre en accès libre le matériel d’enseignement de 32 cours représentatifs des cinq facultés du MIT. Ce matériel d’enseignement comprend des textes de conférences, des travaux pratiques, des exercices et corrigés, des bibliographies, des documents audio et vidéo, etc. Le lancement officiel du site a lieu un an plus tard, en septembre 2003, avec accès à quelques centaines de cours. En mars 2004, 500 cours sont disponibles dans 33 disciplines. En mai 2006, 1.400 cours sont disponibles dans 34 disciplines. La totalité des 1.800 cours dispensés par le MIT est en ligne en novembre 2007, avec actualisation régulière. Certains cours sont traduits en espagnol, en portugais et en chinois avec l’aide d’autres organismes.

Le MIT espère que cette expérience de publication électronique - la première du genre - va permettre de définir un standard et une méthode de publication, et inciter d’autres universités à créer un «opencourseware» pour la mise à disposition gratuite de leurs propres cours. Un «opencourseware» peut être défini comme la publication électronique en accès libre du matériel d’enseignement d'un ensemble de cours. A cet effet, le MIT lance l’OpenCourseWare Consortium (OCW Consortium) en décembre 2005, avec accès libre et gratuit au matériel d’enseignement de cent universités dans le monde un an plus tard.

# Public Library of Science

A l’heure de l’internet, il paraît assez scandaleux que le résultat de travaux de recherche – travaux originaux et demandant de longues années d’efforts – soit détourné par des éditeurs spécialisés s’appropriant ce travail et le monnayant à prix fort. L’activité des chercheurs est souvent financée par les deniers publics, et de manière substantielle en Amérique du Nord. Il semblerait donc normal que la communauté scientifique et le grand public puissent bénéficier librement du résultat de ces recherches.

Dans le domaine scientifique et médical par exemple, 1.000 nouveaux articles sont publiés chaque jour, en ne comptant que les articles révisés par les pairs. Se basant sur ce constat, la Public Library of Science (PLoS) est fondée en octobre 2000 à San Francisco à l’initiative de Harold Varmus, Patrick Brown et Michael Eisen, chercheurs dans les universités de Stanford et Berkeley (Californie). Le but est de contrer les pratiques de l’édition spécialisée en regroupant tous les articles scientifiques et médicaux au sein d’archives en ligne en accès libre. Au lieu d’une information disséminée dans des millions de rapports et des milliers de périodiques en ligne ayant chacun des conditions d’accès différentes, un point d’accès unique permettrait de lire le contenu intégral de ces articles, avec moteur de recherche multicritères et système d’hyperliens entre les articles.

Pour ce faire, la PLoS fait circuler une lettre ouverte demandant que les articles publiés par les éditeurs spécialisés soient distribués librement dans un service d’archives en ligne, et incitant les signataires de cette lettre à promouvoir les éditeurs prêts à soutenir ce projet. La réponse de la communauté scientifique internationale est remarquable. Au cours des deux années suivantes, la lettre ouverte est signée par 30.000 chercheurs de 180 pays. Bien que la réponse des éditeurs soit nettement moins enthousiaste, plusieurs éditeurs donnent également leur accord pour une distribution immédiate des articles publiés par leurs soins, ou alors une distribution dans un délai de six mois. Mais dans la pratique, même les éditeurs ayant donné leur accord formulent nombre d’objections au nouveau modèle proposé, si bien que le projet d’archives en ligne ne voit finalement pas le jour.

Un autre objectif de la Public Library of Science est de devenir elle- même éditeur. La PLoS fonde donc une maison d’édition scientifique non commerciale qui reçoit en décembre 2002 une subvention de 9 millions de dollars US de la part de la Moore Foundation. Une équipe éditoriale de haut niveau est constituée en janvier 2003 pour lancer des périodiques de qualité selon un nouveau modèle d’édition en ligne basé sur la diffusion libre du savoir.

Le premier numéro de PLoS Biology sort en octobre 2003, avec une version en ligne gratuite et une version imprimée au prix coûtant (couvrant uniquement les frais de fabrication et de distribution). PLoS Medicine est lancé en octobre 2004. Trois nouveaux titres voient le jour en 2005: PLoS Genetics, PLoS Computational Biology et PLoS Pathogens. PLoS Clinical Trials voit le jour en 2006. PloS Neglected Tropical Diseases est lancé à l’automne 2007 en tant que première publication scientifique consacrée aux maladies tropicales négligées. Ces maladies affectent les populations pauvres, aussi bien dans les zones rurales que dans les zones urbaines.

Tous les articles de ces périodiques sont librement accessibles en ligne, sur le site de la PLoS et dans PubMed Central, le service d’archives en ligne public et gratuit de la National Library of Medicine (Etats-Unis), avec moteur de recherche multicritères. Les versions imprimées sont abandonnées en 2006 pour laisser place à un service d’impression à la demande proposé par la société Odyssey Press. Ces articles peuvent être librement diffusés et réutilisés ailleurs, y compris pour des traductions, selon les termes de la licence Creative Commons, la seule contrainte étant la mention des auteurs et de la source. La PLoS lance aussi PLoS ONE, un forum en ligne permettant la publication d’articles sur tout sujet scientifique et médical.

Le succès est total. Trois ans après les débuts de la Public Library of Science en tant qu’éditeur, PLoS Biology et PLos Medicine ont la même réputation d’excellence que les grandes revues Nature, Science ou The New England Journal of Medicine. La PLoS reçoit le soutien financier de plusieurs fondations tout en mettant sur pied un modèle économique viable, avec des revenus émanant des frais de publication payés par les auteurs, et émanant aussi de la publicité, des sponsors et des activités destinées aux membres de la PLoS. De plus, la PLoS souhaite que ce modèle économique d’un genre nouveau inspire d’autres éditeurs pour créer des revues du même type ou pour mettre des revues existantes en accès libre.

# Wikipédia

Issu du terme hawaïen «wiki» (qui signifie: vite, rapide), un wiki est un site web permettant à plusieurs utilisateurs de collaborer en ligne sur un même projet. A tout moment, ces utilisateurs peuvent contribuer à la rédaction du contenu, modifier ce contenu et l'enrichir en permanence. Le wiki est utilisé par exemple pour créer et gérer des dictionnaires, des encyclopédies ou encore des sites d'information sur un sujet donné. Le programme présent derrière l'interface d'un wiki est plus ou moins élaboré. Un programme simple gère du texte et des hyperliens. Un programme élaboré permet d'inclure des images, des graphiques, des tableaux, etc. L’encyclopédie wiki la plus connue est Wikipédia.

Créée en janvier 2001 à l’initiative de Jimmy Wales et de Larry Sanger, Wikipédia est une encyclopédie gratuite écrite collectivement et dont le contenu est librement réutilisable. Elle est immédiatement très populaire. Sans publicité et financée par des dons, cette encyclopédie coopérative est rédigée par des milliers de volontaires - appelés Wikipédiens, et qui s'inscrivent en prenant un pseudonyme - avec possibilité de corriger et de compléter les articles, aussi bien les leurs que ceux d'autres contributeurs. Les articles restent la propriété de leurs auteurs, et leur libre utilisation est régie par la licence GFDL (GNU free documentation license).

En décembre 2004, Wikipédia compte 1,3 million d'articles rédigés dans 100 langues par 13.000 contributeurs. En décembre 2006, elle compte 6 millions d'articles dans 250 langues, et elle est un de dix sites les plus visités du web. En mai 2007, la version francophone fête ses 500.000 articles. A la même date, Wikipédia compte 7 millions d'articles dans 192 langues, dont 1,8 million en anglais, 589.000 en allemand, 260.000 en portugais et 236.000 en espagnol.

Fondée en juin 2003, la Wikimedia Foundation gère non seulement Wikipédia mais aussi Wiktionary, un dictionnaire et thésaurus multilingue lancé en décembre 2002, puis Wikibooks (livres et manuels en cours de rédaction) lancé en juin 2003, auxquels s'ajoutent ensuite Wikiquote (répertoire de citations), Wikisource (textes appartenant au domaine public), Wikimedia Commons (sources multimédia), Wikispecies (répertoire d'espèces animales et végétales), Wikinews (site d'actualités) et enfin Wikiversity (matériel d'enseignement), lancé en août 2006. La fin 2007 voit le lancement d'un moteur de recherche dénommé Wiki Search, qui utilise le réseau de contributeurs de Wikipédia pour classer les sites en fonction de leur qualité.

# Citizendium

Une nouvelle étape s’ouvre avec les débuts de Citizendium (abrégé de: The Citizens’ Compendium), une grande encyclopédie collaborative en ligne conçue en novembre 2006 et lancée en mars 2007 (version bêta) par Larry Sanger, co-fondateur de Wikipédia, mais qui quitte ensuite l’équipe de Wikipédia suite à des problèmes de qualité de contenu.

Citizendium est basé sur le même modèle que Wikipédia - collaborative et gratuite - tout en évitant ses travers - vandalisme et manque de rigueur. Les auteurs signent leurs articles de leur vrai nom, et ces articles sont édités par des experts («editors») âgés d'au moins 25 ans et titulaires d'une licence universitaire. De plus, des «constables» sont chargés de la bonne marche du projet et du respect du règlement. Le jour de son lancement le 25 mars 2007, Citizendium comprend 1.100 articles, 820 auteurs et 180 experts. 9.800 articles sont disponibles en janvier 2009.

Dans "Why Make Room for Experts in Web 2.0?", une communication datée d’octobre 2006 et actualisée depuis, Larry Sanger voit dans Citizendium l’émergence d’un nouveau modèle de collaboration massive de dizaines de milliers d’intellectuels et scientifiques, non seulement pour les encyclopédies, mais aussi pour les manuels d’enseignement, les ouvrages de référence, le multimédia et les applications en 3D. Cette collaboration est basée sur le partage des connaissances, dans la lignée du web 2.0, un concept lancé en 2004 pour caractériser les notions de communauté et de partage et qui se manifeste d’abord par une floraison de wikis, blogs et sites sociaux. D’après Larry Sanger, il importe aussi de créer des structures permettant des collaborations scientifiques, et Citizendium pourrait servir de prototype dans ce domaine.

# Encyclopedia of Life

Cet appel semble se concrétiser rapidement avec le lancement en mai 2007 du projet de l’Encyclopedia of Life. Cette vaste encyclopédie collaborative en ligne rassemblera les connaissances existantes sur toutes les espèces animales et végétales connues (1,8 million), y compris les espèces en voie d’extinction, avec l’ajout de nouvelles espèces au fur et à mesure de leur identification, ce qui représenterait entre 8 et 10 millions d'espèces en tout.

Il s’agira d’une encyclopédie multimédia permettant de ressembler textes, photos, cartes, bandes sonores et vidéos, avec une page web par espèce, et permettant aussi d’offrir un portail unique à des millions de documents épars, en ligne et hors ligne. Outil d’apprentissage et d’enseignement pour une meilleure connaissance de notre planète, cette encyclopédie sera à destination de tous: scientifiques, enseignants, étudiants, scolaires, médias, décideurs et grand public.

Ce projet collaboratif est mené par plusieurs grandes institutions:
Field Museum of Natural History, Harvard University, Marine Biological
Laboratory, Missouri Botanical Garden, Smithsonian Institution et
Biodiversity Heritage Library.

Le directeur honoraire du projet est Edward Wilson, professeur émérite à l’Université de Harvard, qui - dans un essai daté de 2002 - est le premier à émettre le voeu d’une telle encyclopédie. Cinq ans après - en 2007 - c'est désormais chose possible grâce aux avancées technologiques récentes, notamment les outils logiciels permettant l’agrégation de contenu, le mash-up (à savoir le fait de rassembler un contenu donné à partir de nombreuses sources différentes), les wikis de grande taille et la gestion de contenu à vaste échelle.

En tant que consortium des dix plus grandes bibliothèques des sciences de la vie (d’autres suivront), la Biodiversity Heritage Library a d’ores et déjà débuté la numérisation de 2 millions de documents, dont les dates de publication s’étalent sur 200 ans. En mai 2007, date du lancement officiel du projet, on compte déjà 1,25 million de pages traitées dans les centres de numérisation de Londres, Boston et Washington DC, et disponibles sur le site de l’Internet Archive.

Le financement initial est assuré par la MacArthur Foundation (10 millions de dollars US) et la Sloan Foundation (2,5 millions de dollars). 100 millions de dollars sont nécessaires pour un financement sur dix ans, avant que l'encyclopédie ne puisse s'autofinancer. La réalisation des pages web débute courant 2007. L’encyclopédie fait ses débuts à la mi-2008. Opérationnelle d'ici 2012, elle devrait être complète - c'est-à-dire à jour - en 2017.

Dans la lignée du "Human Genome Project" (Séquencage du génome humain), publié pour la première fois en février 2001 et appartenant d'emblée au domaine public, l’Encyclopedia of Life permettra de proposer toutes les connaissances disponibles à ce jour sur les espèces animales et végétales. La version initiale sera d’abord en anglais avant d’être traduite en plusieurs langues par de futurs organismes partenaires.

L'encyclopédie sera aussi un «macroscope» permettant de déceler les grandes tendances à partir d’un stock d’informations considérable, à la différence du microscope permettant l’étude de détail.

En plus de sa flexibilité et de sa diversité, elle permettra à chacun de contribuer au contenu sous une forme s’apparentant au wiki, ce contenu étant ensuite validé ou non par des scientifiques.