[Résumé] «Qu’il me suffise, pour le moment, de redire la sentence classique: "La bibliothèque est une sphère dont le centre véritable est un hexagone quelconque, et dont la circonférence est inaccessible".» Cette citation de Jorge Luis Borges – issue de La bibliothèque de Babel (1941) - pourrait tout aussi bien définir la bibliothèque numérique. La numérisation du patrimoine mondial est en cours, d'abord pour le texte, et ensuite pour l’image et le son, avec la mise en ligne de centaines puis de milliers d’oeuvres du domaine public, de publications littéraires et scientifiques, d’articles, d’images, de bandes sonores et de films, gratuits ou payants selon les documents. De plus, certaines bibliothèques utilisent le web pour faire connaître les joyaux de leurs collections, pendant que d'autres créent des «cyberespaces» pour leurs usagers, avec des bibliothécaires devenus cyberthécaires pour les piloter dans leurs recherches et les orienter sur la toile.
= Des bibliothèques numériques
# De l'imprimé au numérique
La première bibliothèque traditionnelle présente sur le web est la bibliothèque municipale d’Helsinki (Finlande), qui inaugure son site en février 1994. Objectif poursuivi par des générations de bibliothécaires, la diffusion du livre devient enfin possible à vaste échelle.
Fondateur de la bibliothèque numérique Athena, Pierre Perroud insiste en février 1997 sur la complémentarité du texte électronique et du livre imprimé, dans un article de la revue Informatique-Informations (Genève). Selon lui, «les textes électroniques représentent un encouragement à la lecture et une participation conviviale à la diffusion de la culture», notamment pour l’étude de ces textes et la recherche textuelle. Ces textes électroniques «sont un bon complément du livre imprimé - celui-ci restant irremplaçable lorsqu’il s’agit de lire». Mais le livre imprimé reste «un compagnon mystérieusement sacré vers lequel convergent de profonds symboles: on le serre dans la main, on le porte contre soi, on le regarde avec admiration; sa petitesse nous rassure autant que son contenu nous impressionne; sa fragilité renferme une densité qui nous fascine; comme l’homme il craint l’eau et le feu, mais il a le pouvoir de mettre la pensée de celui-là à l’abri du Temps.»
Si certaines bibliothèques numériques naissent directement sur le web, la plupart émanent de bibliothèques traditionnelles. En 1996, la bibliothèque municipale de Lisieux (Normandie, France) lance la Bibliothèque électronique de Lisieux, qui offre les versions numériques d'oeuvres littéraires courtes choisies dans les collections municipales. En 1997, la Bibliothèque nationale de France (BnF) crée Gallica qui, dans un premier temps, propose des images et textes du 19e siècle francophone, à savoir une sélection de 3.000 livres complétée par un échantillon de la future iconothèque numérique. En 1998, la Bibliothèque municipale de Lyon met les enluminures de 200 manuscrits et incunables à la disposition de tous sur son site web. Trois exemples parmi tant d’autres.
# La numérisation des livres
Qui dit bibliothèque numérique dit numérisation, au moins les premiers temps, puisque les livres numériques émanent de livres imprimés. Pour pouvoir être consulté à l’écran, un livre peut être numérisé soit en mode texte soit en mode image.
La numérisation en mode texte consiste d'abord à patiemment saisir le livre sur un clavier, page après page, solution souvent adoptée lors de la constitution des premières bibliothèques numériques, ou alors quand les documents originaux manquent de clarté, pour les livres anciens par exemple. Les années passant, la numérisation en mode texte consiste surtout à scanner le livre en mode image, puis à le convertir en texte grâce à un logiciel OCR (Optical Character Recognition), avec relecture éventuelle à l’écran pour corriger le texte obtenu puisqu'un bon logiciel OCR serait fiable à 99%.
La version informatique du livre ne conserve pas la présentation originale du livre ou de la page. Le livre devient texte, à savoir un ensemble de caractères apparaissant en continu à l’écran. A cause du temps passé au traitement de chaque livre, ce mode de numérisation est assez long, et donc nettement plus coûteux que la numérisation en mode image. Dans de nombreux cas, il est toutefois très préférable, puisqu’il permet l’indexation, la recherche textuelle, l’analyse textuelle, une étude comparative entre plusieurs textes ou plusieurs versions du même texte, etc. C’est la méthode utilisée par exemple par le Projet Gutenberg, fondé dès 1971 et qui propose aujourd'hui la plus grande bibliothèque numérique au format texte, avec des livres relus et corrigés deux fois pour être fiables à 99,9% par rapport à la version imprimée.