2006: VERS UNE BIBLIOTHEQUE NUMERIQUE PLANETAIRE

= [Résumé]

Lancée en octobre 2005 à l’instigation de l’Internet Archive, l’Open Content Alliance (OCA) - – qui débute véritablement en 2006 - est un vaste projet public et coopératif de bibliothèque numérique mondiale proposant un répertoire multilingue de livres et documents multimédia pour consultation et téléchargement sur tout moteur de recherche. L'OCA regroupe de nombreux partenaires: bibliothèques, universités, organisations gouvernementales, associations à but non lucratif, organismes culturels, sociétés informatiques (Adobe, Hewlett Packard, Microsoft, Yahoo!, Xerox, etc.). Les premiers participants sont les bibliothèques des universités de Californie et de Toronto, l'European Archive, les Archives nationales du Royaume-Uni, O'Reilly Media et les Prelinger Archives. L’OCA souhaite s’inspirer de l’initiative de Google tout en évitant ses travers, à savoir la numérisation de livres sous droits sans l’accord préalable des éditeurs, tout comme la consultation et le téléchargement impossibles sur un autre moteur de recherche.

= L'Internet Archive

En réaction au projet Google Books, l’Internet Archive pense qu'une bibliothèque à vocation mondiale ne doit pas être liée à des enjeux commerciaux. Elle s'associe en janvier 2005 à Yahoo! pour mettre sur pied l’Open Content Alliance (OCA), dans l'optique de fédérer un grand nombre de partenaires pour créer une bibliothèque planétaire publique respectueuse du copyright et sur un modèle ouvert.

Qu’est-ce exactement que l’Internet Archive? Fondée en avril 1996 par Brewster Kahle à San Francisco (Californie), l’Internet Archive a pour but de constituer, stocker, préserver et gérer une «bibliothèque» de l’internet, en archivant la totalité du web tous les deux mois, afin d’offrir un outil de travail aux universitaires, chercheurs et historiens, et de préserver un historique de l’internet pour les générations futures.

En octobre 2001, l’Internet Archive met ses archives en accès libre sur le web grâce à la Wayback Machine, qui permet à tout un chacun de consulter l’historique d’un site web, à savoir le contenu et la présentation d’un site web à différentes dates, théoriquement tous les deux mois à partir de 1996.

L’Internet Archive débute aussi la constitution de collections numériques telles que le Million Book Project (10.520 livres en avril 2005), des archives de films de la période 1903-1973, des archives de concerts live récents, des archives de logiciels, etc. Toutes ces collections sont en consultation libre sur le web.

= L'Open Content Alliance

En janvier 2005, l’Internet Archive s’associe à Yahoo! pour mettre sur pied l’Open Content Alliance (OCA), une initiative visant à créer un répertoire libre et multilingue de livres numérisés et de documents multimédia pour consultation sur n’importe quel moteur de recherche.

L’OCA est officiellement lancée en octobre 2005 et débute véritablement en 2006. Le but de l’initiative est de s’inspirer de Google Books tout en évitant ses travers, à savoir la numérisation des livres sous droits sans l’accord préalable des éditeurs, tout comme la consultation et le téléchargement impossibles sur un autre moteur de recherche.

L’OCA regroupe de nombreux partenaires: des bibliothèques et des universités bien sûr, mais aussi des organisations gouvernementales, des associations à but non lucratif, des organismes culturels et des sociétés informatiques (Adobe, Hewlett Packard, Microsoft, Yahoo!, Xerox, etc.).

Les premiers partenaires sont les bibliothèques des universités de Californie et de Toronto, l’European Archive, les Archives nationales du Royaume-Uni, O’Reilly Media et les Prelinger Archives. Seuls les livres appartenant au domaine public sont numérisés, pour éviter les problèmes de copyright auxquels se heurte Google. Les collections numérisées sont intégrées à la section Text Archive de l’Internet Archive.

En décembre 2006, l’Open Content Alliance franchit la barre des 100.000 livres numérisés, avec un rythme de 12.000 nouveaux livres par mois. A la même date, l’Internet Archive reçoit une subvention d'un million de dollars de la part de la Sloan Foundation pour numériser les collections du Metropolitan Museum of Art (l’ensemble des livres et plusieurs milliers d’images) ainsi que certaines collections de la Boston Public Library (les 3.800 livres de la bibliothèque personnelle de John Adams, deuxième président des Etats-Unis), du Getty Research Institute (une série de livres d'art), de la John Hopkins University (une série de documents liés au mouvement anti-esclavagiste) et de l’Université de Californie à Berkeley (une série de documents relatifs à la ruée vers l’or).

En mai 2007, l’Open Content Alliance franchit la barre des 200.000 livres numérisés.

La barre du million de livres numérisés est atteinte en décembre 2008.

Si Microsoft est un des partenaires de l'OCA, il se lance également dans l’aventure à titre personnel. En décembre 2006 est mise en ligne aux Etats-Unis la version bêta de Live Search Books, qui permet une recherche par mots-clés dans les livres du domaine public. Ces livres sont numérisés par Microsoft suite à des accords passés avec de grandes bibliothèques, les premières étant la British Library et les bibliothèques des universités de Californie et de Toronto, suivies en janvier 2007 par celles de la New York Public Library et de l’Université Cornell. Microsoft compte aussi ajouter des livres sous droits, mais uniquement avec l’accord préalable des éditeurs.

Tout comme Google Books, Live Search Books permet de consulter des extraits comportant les mots-clés, qui sont eux-même surlignés. Mais les collections sont moins riches que celles de Google Books, le moteur de recherche est plus rudimentaire, et il n'est pas possible de télécharger les livres au format PDF dans leur entier.

En mai 2007, Microsoft annonce des accords avec plusieurs grands éditeurs, dont Cambridge University Press et McGraw Hill.

Microsoft met finalement un terme à ce projet en mai 2008 pour concentrer ses efforts sur d'autres activités. Les 750.000 livres déjà numérisés sont versés dans les collections de l'Open Content Alliance.

= Europeana

En Europe, certains s’inquiètent de l'«hégémonie américaine» que représente Google Books. Il existe sur le web une Bibliothèque européenne, qui est en fait un portail commun aux 43 bibliothèques nationales, lancé en janvier 2004 par la CENL (Conference of European National Librarians) et hébergé sur le site de la Bibliothèque nationale des Pays-Bas.

En septembre 2005, la Commission européenne lance une vaste consultation sur un projet de bibliothèque numérique européenne, avec réponse requise en janvier 2006, suite à quoi le projet est officiellement lancé en mars 2006.

«Le plan de la Commission européenne visant à promouvoir l’accès numérique au patrimoine de l’Europe prend forme rapidement, lit-on dans le communiqué de presse. Dans les cinq prochaines années, au moins six millions de livres, documents et autres oeuvres culturelles seront mis à la disposition de toute personne disposant d’une connexion à l’internet, par l’intermédiaire de la "bibliothèque numérique européenne". Afin de stimuler les initiatives de numérisation européennes, la Commission va cofinancer la création d’un réseau paneuropéen de centres de numérisation. La Commission abordera également, dans une série de documents stratégiques, la question du cadre approprié à adopter pour assurer la protection des droits de propriété intellectuelle dans le cadre des bibliothèques numériques.»

Europeana et ses deux millions de documents sont disponibles en novembre 2008, avec un serveur qui déclare rapidement forfait suite à la très forte demande des premières heures, puis une période expérimentale avec consultation partielle des collections suite au «renforcement» de la capacité de ce serveur.