L’OCA regroupe de nombreux partenaires: des bibliothèques et des universités bien sûr, mais aussi des organisations gouvernementales, des associations à but non lucratif, des organismes culturels et des sociétés informatiques (Adobe, Hewlett Packard, Microsoft, etc.). Les premiers partenaires sont les bibliothèques des Universités de Californie et de Toronto, l’European Archive, les Archives nationales du Royaume-Uni, O’Reilly Media et Prelinger Archives. Seuls les livres appartenant au domaine public sont numérisés, pour éviter les problèmes de copyright auxquels se heurte Google. Les collections numérisées alimenteront la section Text Archive de l’Internet Archive.

Qu’est-ce exactement que l’Internet Archive, l'organisme pilotant l'Open Content Alliance? Fondée en avril 1996 par Brewster Kahle à San Francisco, l’Internet Archive a pour but premier de constituer, stocker, préserver et gérer une «bibliothèque» de l’internet, en archivant la totalité du web tous les deux mois, afin d’offrir un outil de travail aux universitaires, chercheurs et historiens, et de préserver un historique de l’internet pour les générations futures. En octobre 2001, l’Internet Archive met ses archives en accès libre sur le web grâce à la Wayback Machine, qui permet à tout un chacun de consulter l’historique d’un site web, à savoir le contenu et la présentation d’un site web à différentes dates, théoriquement tous les deux mois, à partir de 1996. L’Internet Archive débute aussi la constitution de collections numériques telles que le Million Book Project (10.520 livres en avril 2005), des archives de films de la période 1903-1973, des archives de concerts live récents, des archives de logiciels, etc. Toutes ces collections sont en consultation libre sur le web.

En décembre 2006, l’Open Content Alliance franchit la barre des 100.000 livres numérisés, avec un rythme de 12.000 nouveaux livres par mois. A la même date, l’Internet Archive reçoit une subvention de 1 million de dollars de la part de la Sloan Foundation pour numériser les collections du Metropolitan Museum of Art (l’ensemble des livres et plusieurs milliers d’images) ainsi que certaines collections de la Boston Public Library (les 3.800 livres de la bibliothèque personnelle de John Adams, deuxième président des Etats-Unis), du Getty Research Institute, de la John Hopkins University (une série de documents liés au mouvement anti-esclavagiste) et de l’Université de Californie à Berkeley (une série de documents relatifs à la ruée vers l’or). En mai 2007, l’Open Content Alliance franchit la barre des 200.000 livres numérisés.

= Autres initiatives

Si Microsoft est l’un des partenaires de l’Open Content Alliance, il se lance également dans l’aventure à titre personnel. En décembre 2006 est mise en ligne aux Etats-Unis la version bêta de Live Search Books, qui permet une recherche par mots-clés dans les livres du domaine public. Ces livres sont numérisés par Microsoft suite à des accords passés avec de grandes bibliothèques, les premières étant la British Library et les bibliothèques des Universités de Californie et de Toronto, suivies en janvier 2007 par celles de la New York Public Library et de l’Université Cornell. Microsoft compte aussi ajouter des livres sous droits, mais uniquement avec l’accord préalable des éditeurs. Tout comme Google Book Search, Live Search Books permet de consulter les livres avec les mots-clés surlignés. Par la suite, il sera possible de télécharger les livres dans leur entier au format PDF. A ce stade, la base est beaucoup moins riche que celle de Google Book Search et son moteur de recherche plus rudimentaire. En mai 2007, Microsoft annonce des accords avec plusieurs grands éditeurs américains, dont Cambridge University Press et McGraw Hill.

En Europe, certains s’inquiètent d’une soi-disant hégémonie américaine. En septembre 2005, la Commission européenne lance une vaste consultation sur un projet de bibliothèque numérique européenne, avec réponse requise en janvier 2006. Le projet est officiellement lancé en mars 2006. «Le plan de la Commission européenne visant à promouvoir l’accès numérique au patrimoine de l’Europe prend forme rapidement, lit-on dans le communiqué de presse. Dans les cinq prochaines années, au moins six millions de livres, documents et autres oeuvres culturelles seront mis à la disposition de toute personne disposant d’une connexion à l’internet, par l’intermédiaire de la "bibliothèque numérique européenne". Afin de stimuler les initiatives de numérisation européennes, la Commission va cofinancer la création d’un réseau paneuropéen de centres de numérisation. La Commission abordera également, dans une série de documents stratégiques, la question du cadre approprié à adopter pour assurer la protection des droits de propriété intellectuelle dans le cadre des bibliothèques numériques.» Cette bibliothèque numérique européenne devrait être accessible à partir de la Bibliothèque européenne, un portail commun aux 43 bibliothèques nationales d’Europe lancé en janvier 2004 par la CENL (Conference of European National Librarians) et hébergé par la Bibliothèque nationale des Pays-Bas.

7.6. Chronologie

* Cette chronologie ne prétend pas à l’exhaustivité.

1971 (juillet): Le Projet Gutenberg, fondé par Michael Hart.

1993: L’Online Books Page, créée par John Mark Ockerbloom.