7.5. Une future bibliothèque planétaire
En 2005, alors que le Projet Gutenberg poursuit tranquillement la mise en ligne gratuite des oeuvres du domaine public, une tâche immense entreprise depuis nombre d’années, le livre devient un objet convoité par les géants de l’internet que sont Google, Yahoo! et Microsoft, d’une part par souci méritoire de mettre le patrimoine mondial à la disposition de tous, d’autre part à cause de l’enjeu représenté par les recettes publicitaires générées par les liens commerciaux accolés aux résultats des recherches. L’Internet Archive considère quant à elle qu’un projet de cette ampleur ne doit pas être lié à des enjeux commerciaux et fonde à cet effet l’Open Content Alliance (OCA) pour fédérer un grand nombre de partenaires dans l’optique d’une bibliothèque planétaire publique.
= Google Book Search / Google Livres
Le moteur de recherche Google décide de mettre son expertise au service du livre. En octobre 2004, il lance la première partie de son programme Google Print, établi en partenariat avec les éditeurs pour pouvoir consulter à l’écran des extraits de livres, puis commander les livres auprès d’une librairie en ligne. La version bêta de Google Print est mise en ligne en mai 2005. En novembre 2004, Google lance Google Scholar, qui indexe la production scientifique et universitaire disponible sur le web. En décembre 2004, Google lance la deuxième partie de son programme Google Print, cette fois à destination des bibliothèques. Il s’agit d’un projet de bibliothèque numérique de 15 millions de livres consistant à numériser plusieurs grandes bibliothèques partenaires, à commencer par la bibliothèque de l’Université du Michigan (dans sa totalité, à savoir 7 millions d’ouvrages), les bibliothèques des Universités de Harvard, de Stanford et d’Oxford, et celle de la ville de New York. Le coût estimé au départ se situe entre 150 et 200 millions de dollars US, avec la numérisation de 10 millions de livres sur six ans, et une durée totale de dix ans. En août 2005, Google Print est suspendu pour un temps indéterminé pour cause de conflit avec les éditeurs de livres sous droits.
Le programme reprend en août 2006 sous le nouveau nom de Google Book Search, dénommé Google Livres pour la version française. Google Book Search permet des recherches par date, titre ou éditeur. La numérisation des fonds de grandes bibliothèques se poursuit, axée cette fois sur les livres libres de droit, tout comme le développement de partenariats avec les éditeurs qui le souhaitent. Les livres libres de droit sont consultables à l’écran en texte intégral, leur contenu est copiable et l’impression est possible page à page. Ils sont également téléchargeables sous forme de fichiers PDF et imprimables dans leur entier. Les liens publicitaires associés aux pages de livres sont situés en haut et à droite de l’écran. Le conflit avec les éditeurs se poursuit lui aussi, puisque Google continue de numériser des livres sous droits sans l’autorisation préalable des éditeurs en invoquant le droit de citation pour présenter des extraits sur le web. L’Authors Guild et l’Association of American Publishers (AAP) invoquent pour leur part le non respect de la législation relative au copyright pour attaquer Google en justice. Le feuilleton judiciaire promet de durer.
Alexandre Laumonier, directeur des éditions Kargo, participe au programme Google Livres en France. Dans La non affaire Google Livres, suite, un texte daté de juin 2006 et publié sur le site de l’éditeur, il propose une analyse lucide des véritables enjeux: «Sur le fond, au-delà des discours et des rebonds, au-delà des problèmes juridiques à régler, au-delà des intérêts économiques et/ou corporatistes que chacun(e) essaie de défendre, au-delà des technologies encore balbutiantes, au-delà d’un antiaméricanisme primaire qui se révèle ici et là, au fond les véritables interrogations que posent les transformations technologiques, notamment lorsqu’elles impliquent certaines formes de savoir, sont celles du partage de l’information, du savoir en tant que bien commun, des qualités et des défauts de l’écriture numérique, qui permet désormais une maniabilité du savoir comme jamais cela n’avait été possible auparavant. Rarement trouve-t-on, dans les quelques discussions ici et là sur Google Livres, les mots "bien commun", "partage du savoir", "démocratisation de l’écriture"… Car c’est bien de cela dont il s’agit, au moment où l’on constate que l’objet-livre, qui symboliquement et dans les faits, était jusqu’à maintenant le seul garant d’une vérité, ne l’est plus (seulement).»
Michel Valensi, directeur des éditions de l’Eclat, passe lui aussi un partenariat avec Google Livres en août 2005. Dans Faut-il une grande cuiller pour signer avec Google? (version 2.0), un texte en ligne daté de septembre 2006 et disponible sur le site de l’éditeur, il explique: «Le projet Google Livres est le premier projet de grande envergure (il en existait d’autres auparavant, parmi lesquels le lyber lui-même; il en existera d’autres dans les mois à venir) qui permet une entrée en force du Livre dans l’internet. Après la multiplication des sites de toutes sortes sur les sujets les plus divers et la prolifération épidémique des blogs (dont le terme même, onomatopéïque, dit toute la profondeur: blog!) on en revient au Livre comme source première d’information. On permet l’accès à une partie des contenus, on permet une recherche thématique à l’intérieur du livre, on renvoie à d’autres livres, à l’éditeur, vers des librairies, etc., mais jamais on ne se substitue au livre, dont la forme reste omni-présente à travers l’image même des pages consultées. Contrairement aux sites, on ne peut ni télécharger, ni imprimer. Paradoxalement, Google Livres indique ainsi les limites d’une information infinie (qui est un leurre) surfant de blogs en sites, et propose un retour (qui est une avancée) vers un médium ancien, encore aujourd’hui sans équivalent.»
Fin 2006, Google scanne 3.000 livres par jour, ce qui représenterait un million de livres par an. Le coût estimé serait de 30 dollars par livre - d'autres sources mentionnent un coût double - et les collections actuelles se monteraient à 3 millions de livres. Tous chiffres à prendre avec précaution, la société ne communiquant pas de statistiques à ce sujet. A l’exception de la New York Public Library, les collections en cours de numérisation appartiennent toutes à des bibliothèques universitaires (Harvard, Stanford, Michigan, Oxford, Californie, Virginie, Wisconsin-Madison, Complutense de Madrid). S’y ajoutent début 2007 les bibliothèques des Universités de Princeton et du Texas (Austin), ainsi que la Biblioteca de Catalunya (Catalogne, Espagne) et la Bayerische Staatbibliothek (Bavière, Allemagne). En mai 2007, Google annonce la participation de la première bibliothèque francophone, la Bibliothèque cantonale et universitaire (BCU) de Lausanne (Suisse), pour la numérisation de 100.000 titres en français, allemand et italien publiés entre le 17e et le 19e siècle, qui seront consultables dans leur intégralité et téléchargeables au format PDF.
= Open Content Alliance
Parallèlement est lancée une autre initiative du même genre, mais cette fois respectueuse du copyright et sur un modèle ouvert. En janvier 2005, l’Internet Archive s’associe à Yahoo! pour mettre sur pied l’Open Content Alliance (OCA), une initiative visant à créer un répertoire libre et multilingue de livres numérisés et de documents multimédias pour consultation sur n’importe quel moteur de recherche. L’OCA est officiellement lancée en octobre 2005. Un site de démonstration, l’Open Library, présente quelques livres numérisés issus des fonds de l’Université de Californie. Le but de l’initiative est de s’inspirer de Google Livres tout en évitant ses travers, à savoir la numérisation des livres sous droits sans l’accord préalable des éditeurs, tout comme la consultation et le téléchargement impossibles sur un autre moteur de recherche.