VERS UNE BIBLIOTHÈQUE PLANÉTAIRE
[Résumé] En 2005, le livre devient un objet convoité par les géants de l’internet que sont Google, Yahoo! et Microsoft, d’une part par souci méritoire de mettre le patrimoine mondial à la disposition de tous, d’autre part à cause de l’enjeu représenté par les recettes publicitaires générées par les liens commerciaux accolés aux résultats des recherches. Lancée en octobre 2005 à l’instigation de l’Internet Archive, l’Open Content Alliance (OCA) souhaite pour sa part créer une bibliothèque planétaire publique qui soit respectueuse du droit d'auteur et dont les collections puissent être accessibles sur n'importe quel moteur de recherche.
= Google Books
# Google Print
Google décide de mettre son expertise au service du livre et lance la version bêta de Google Print en mai 2005. Ce lancement est précédé de deux étapes.
En octobre 2004, Google lance la première partie de son programme Google Print, établi en partenariat avec les éditeurs pour pouvoir consulter à l’écran des extraits de livres, puis commander les livres auprès d’une librairie en ligne.
En décembre 2004, Google lance la deuxième partie de son programme Google Print, cette fois à destination des bibliothèques. Il s’agit d’un projet de bibliothèque consistant à numériser les livres appartenant à plusieurs grandes bibliothèques partenaires, à commencer par la bibliothèque de l’Université du Michigan (dans sa totalité, à savoir 7 millions d’ouvrages), les bibliothèques des Universités de Harvard, de Stanford et d’Oxford, et celle de la ville de New York. Le coût estimé au départ se situe entre 150 et 200 millions de dollars US, avec la numérisation de 10 millions de livres sur six ans et un chantier d'une durée totale de dix ans.
En août 2005, soit trois mois après son lancement, Google Print est suspendu pour une durée indéterminée suite à un conflit grandissant avec les associations d'auteurs et d'éditeurs de livres sous droits, celles-ci reprochant à Google de numériser les livres sans l'accord préalable des ayants droit.
# Google Livres
Le programme reprend en août 2006 sous le nom de Google Books (Google Livres). Google Books permet de rechercher les livres par date, titre ou éditeur. La numérisation des fonds de grandes bibliothèques se poursuit, tout comme le développement de partenariats avec les éditeurs qui le souhaitent.
Les livres libres de droit sont consultables à l’écran en texte intégral, leur contenu est copiable et l’impression est possible page à page. Ils sont également téléchargeables sous forme de fichiers PDF et imprimables dans leur entier. Les liens publicitaires associés aux pages de livres sont situés en haut et à droite de l’écran.
Le conflit avec les associations d'auteurs et d'éditeurs se poursuit lui aussi, puisque Google continue de numériser des livres sous droits sans l’autorisation préalable des ayants droit, en invoquant le droit de citation pour présenter des extraits sur le web. L’Authors Guild et l’Association of American Publishers (AAP) invoquent pour leur part le non respect de la législation relative au copyright pour attaquer Google en justice.
Fin 2006, d'après le buzz médiatique, Google scannerait 3.000 livres par jour - ce qui représenterait un million de livres par an -, le coût estimé serait de 30 dollars par livre et Google Books comprendrait déjà 3 millions de livres. Tous chiffres à prendre avec précaution, la société ne communiquant pas de statistiques à ce sujet.
À l’exception de la New York Public Library, les collections en cours de numérisation appartiennent toutes à des bibliothèques universitaires américaines (Harvard, Stanford, Michigan, Oxford, Californie, Virginie, Wisconsin-Madison), auxquelles s'ajoutent la bibliothèque de l'Universidad Complutense de Madrid (Espagne) puis, début 2007, les bibliothèques des Universités de Princeton et du Texas (Austin), ainsi que la Biblioteca de Catalunya (Catalogne, Espagne) et la Bayerische Staatbibliothek (Bavière, Allemagne). En mai 2007, Google annonce la participation de la première bibliothèque francophone, la Bibliothèque cantonale et universitaire (BCU) de Lausanne (Suisse), pour la numérisation de 100.000 titres en français, en allemand et en italien publiés entre le 17e et le 19e siècle. Suit ensuite un partenariat avec la Bibliothèque municipale de Lyon (France), signé en juillet 2008 pour numériser 500.000 livres.
En octobre 2008, après trois ans de conflit, Google tente de mettre fin aux poursuites émanant des associations d'auteurs et d'éditeurs. La société propose un accord qui serait basé sur un partage des revenus générés par Google Books ainsi qu'un large accès aux ouvrages épuisés, tout comme le paiement de 125 millions de dollars US à l'Authors Guild et à l'Association of American Publishers (AAP) pour clôturer définitivement ce conflit.
Suite à cet accord, Google pourrait proposer de plus larges extraits de livres, jusqu'à 20% d'un même ouvrage, avec un lien commercial pour acheter une copie - numérique ou non - de l'oeuvre. Les ayants droit auraient la possibilité de participer ou non au projet Google Books, et donc de retirer leurs livres des collections. Par ailleurs, les bibliothèques universitaires et publiques des États-Unis pourraient accéder à un portail gratuit géré par Google et donnant accès aux textes de millions de livres épuisés. Un abonnement permettrait aux universités et aux écoles de consulter les collections des bibliothèques les plus renommées.
En novembre 2008, Google Books comprend 7 millions d'ouvrages numérisés, en partenariat avec 24 bibliothèques et 2.000 éditeurs partenaires. Les 24 bibliothèques partenaires se situent principalement aux États-Unis (16), mais aussi en Allemagne (1), en Belgique (1), en Espagne (2), en France (1), au Japon (1), au Royaume-Uni (1) et en Suisse (1).
En février 2009, Google Books lance un portail spécifique pour téléphone mobile et smartphone, par exemple sur l'iPhone 3G d'Apple ou sur le G1 de T-Mobile. Le catalogue comprend 1,5 million de livres du domaine public, auxquels s'ajoutent 500.000 autres titres téléchargeables hors des États-Unis, du fait d'une législation du copyright moins restrictive dans certains pays.
= L'Open Content Alliance
En réaction au projet Google Books, l’Internet Archive pense qu'une bibliothèque à vocation mondiale ne doit pas être liée à des enjeux commerciaux. Courant 2005, elle lance l’Open Content Alliance (OCA), dans l'optique de fédérer un grand nombre de partenaires pour créer une bibliothèque planétaire publique respectueuse du copyright et sur un modèle ouvert.
Qu’est-ce exactement que l’Internet Archive? Fondée en avril 1996 par Brewster Kahle à San Francisco (Californie), l’Internet Archive a pour but de constituer, stocker, préserver et gérer une «bibliothèque» de l’internet, en archivant la totalité du web tous les deux mois, afin d’offrir un outil de travail aux universitaires, chercheurs et historiens, et de préserver un historique de l’internet pour les générations futures.
En octobre 2001, l’Internet Archive met ses archives en accès libre sur le web grâce à la Wayback Machine, qui permet à tout un chacun de consulter l’historique d’un site web, à savoir le contenu et la présentation d’un site web à différentes dates, théoriquement tous les deux mois à partir de 1996.
L’Internet Archive débute aussi la constitution de collections numériques telles que le Million Book Project (10.520 livres en avril 2005), des archives de films de la période 1903-1973, des archives de concerts live récents, des archives de logiciels, etc. Toutes ces collections sont en consultation libre sur le web.
En janvier 2005, l’Internet Archive s’associe à Yahoo! pour mettre sur pied l’Open Content Alliance (OCA), une initiative visant à créer un répertoire libre et multilingue de livres numérisés et de documents multimédia pour consultation sur n’importe quel moteur de recherche.
L’OCA est officiellement lancée en octobre 2005 et débute véritablement durant l'été 2006. Le but de l’initiative est de s’inspirer de Google Books tout en évitant ses travers, à savoir la numérisation des livres sous droits sans l’accord préalable des éditeurs, tout comme la consultation et le téléchargement impossibles sur un autre moteur de recherche.
L’OCA regroupe de nombreux partenaires: des bibliothèques et des universités bien sûr, mais aussi des organisations gouvernementales, des associations à but non lucratif, des organismes culturels et des sociétés informatiques (Adobe, Hewlett Packard, Microsoft, Yahoo!, Xerox, etc.).
Les premiers partenaires pour la numérisation des livres sont les bibliothèques des Universités de Californie et de Toronto, l’European Archive, les Archives nationales du Royaume-Uni, O’Reilly Media et les Prelinger Archives. Seuls les livres appartenant au domaine public sont numérisés, pour éviter les problèmes de copyright auxquels se heurte Google, et les collections numérisées sont progressivement intégrées à la section Text Archive de l’Internet Archive.
En décembre 2006, l’OCA franchit la barre des 100.000 livres numérisés, avec un rythme de 12.000 nouveaux livres par mois.
À la même date, l’Internet Archive reçoit une subvention d'un million de dollars US de la part de la Sloan Foundation pour numériser les collections du Metropolitan Museum of Art (l’ensemble des livres et plusieurs milliers d’images) ainsi que certaines collections de la Boston Public Library (les 3.800 livres de la bibliothèque personnelle de John Adams, deuxième président des États-Unis), du Getty Research Institute (une collection de livres d'art), de la John Hopkins University (une collection de documents liés au mouvement anti- esclavagiste) et de l’Université de Californie à Berkeley (une collection de documents relatifs à la ruée vers l’or).
En mai 2007, l’OCA franchit la barre des 200.000 livres numérisés. La barre du million de livres numérisés est atteinte en décembre 2008, et celle des deux millions de livres numérisés en mars 2010.
= Autres initiatives
# Microsoft Live Search Books
Si Microsoft est l'un des partenaires de l'Open Content Alliance, la société se lance aussi dans l’aventure à titre personnel. En décembre 2006 est mise en ligne aux États-Unis la version bêta de Live Search Books, qui permet une recherche par mots-clés dans les livres du domaine public. Ces livres sont numérisés par Microsoft suite à des accords passés avec de grandes bibliothèques, les premières étant la British Library et les bibliothèques des Universités de Californie et de Toronto, suivies en janvier 2007 par celles de la New York Public Library et de l’Université Cornell. Microsoft compte également ajouter des livres sous droits, mais uniquement avec l’accord préalable des éditeurs.
Tout comme Google Books, Live Search Books permet de consulter des extraits comportant les mots-clés, qui sont eux-même surlignés. Mais les collections sont moins riches, le moteur de recherche est plus rudimentaire, et il n'est pas possible de télécharger les livres au format PDF dans leur entier.
En mai 2007, Microsoft annonce des accords avec plusieurs grands éditeurs, dont Cambridge University Press et McGraw Hill.
Microsoft met finalement un terme à ce projet en mai 2008, pour concentrer ses efforts sur d'autres activités. Les 750.000 livres déjà numérisés sont versés dans les collections de l'Open Content Alliance.
# Europeana
En Europe, certains s’inquiètent de l'«hégémonie américaine» que représente Google Books.
Il existe déjà sur le web une Bibliothèque européenne, qui est en fait un portail commun aux 43 bibliothèques nationales, lancé en janvier 2004 par la CENL (Conference of European National Librarians) et hébergé sur le site de la Bibliothèque nationale des Pays-Bas.
En septembre 2005, la Commission européenne lance une vaste consultation sur un projet de bibliothèque numérique européenne, avec réponse requise en janvier 2006 et lancement officiel du projet en mars 2006.
«Le plan de la Commission européenne visant à promouvoir l’accès numérique au patrimoine de l’Europe prend forme rapidement, lit-on dans le communiqué de presse. Dans les cinq prochaines années, au moins six millions de livres, documents et autres oeuvres culturelles seront mis à la disposition de toute personne disposant d’une connexion à l’internet, par l’intermédiaire de la "bibliothèque numérique européenne". Afin de stimuler les initiatives de numérisation européennes, la Commission va co-financer la création d’un réseau paneuropéen de centres de numérisation. La Commission abordera également, dans une série de documents stratégiques, la question du cadre approprié à adopter pour assurer la protection des droits de propriété intellectuelle dans le cadre des bibliothèques numériques.»
Europeana et ses deux millions de documents sont disponibles en novembre 2008, avec un serveur qui déclare rapidement forfait suite à la très forte demande des premières heures, puis une période expérimentale avec consultation partielle des collections. Europeana propose 6 millions de documents en mars 2010, puis 10 millions de documents en septembre 2010 avec une nouvelle interface.