Anissa Rachef est bibliothécaire dans cet organisme. "Je suis chargée du catalogage du fonds documentaire qui est constitué de livres, de vidéos, de disques compacts et de disques optiques ainsi que de périodiques, écrit-elle. Avant mon installation à Londres, soit de 1980 à 1983, j'ai travaillé à la bibliothèque universitaire d'Alger en qualité d'attachée de recherche. C'est d'Alger et en deux ans que j'ai préparé le DSB (diplôme supérieur des bibliothèques), diplôme de conservateur assimilé à celui de l'ENSB de Lyon (Ecole nationale supérieure des bibliothèques, devenue ensuite l'ENSSIB - Ecole nationale supérieure des sciences de l'information et des bibliothèques, ndlr). Recrutée selon un statut local depuis septembre 1987 à l'Institut français de Londres, j'y exerce le métier de bibliothécaire au sein d'une équipe de huit membres. Par ailleurs, titulaire d'un diplôme de FLE (français langue étrangère), j'assure des heures d'enseignement de français dans le même institut.

La médiathèque de l'Institut français de Londres fut inaugurée en mai 1996. L'objectif est double: servir un public s'intéressant à la culture et la langue françaises et 'recruter' un public allophone en mettant à disposition des produits d'appel tels que vidéos documentaires, livres audio, CD-Rom. La mise en place récente d'un espace multimédia sert aussi à fidéliser les usagers. L'installation d'un service d'information rapide a pour fonction de répondre dans un temps minimum à toutes sortes de questions posées via courrier électronique, ou par fax. Ce service exploite les nouvelles technologies pour des recherches très spécialisées. Nous élaborons également des dossiers de presse destinés aux étudiants et professeurs préparant des examens de niveau secondaire. Je m'occupe essentiellement de catalogage, d'indexation et de cotation. Je suis chargée également du service de prêt inter-bibliothèques. J'anime des ateliers in situ de catalogage UNIMARC (MARC: machine readable catalogue) ainsi que des ateliers d'indexation RAMEAU (répertoire d'autorités matières encyclopédique et alphabétique unifié). J'élabore ponctuellement des aménagements de vedettes matières propres à notre catalogue. J'utilise internet pour des besoins de base. Recherches bibliographiques, commande de livres, courrier professionnel, prêt inter-bibliothèques. C'est grâce à internet que la consultation de catalogues collectifs, tels SUDOC (Système universitaire de documentation) et OCLC (Online Computer Library Center), a été possible. C'est ainsi que que j'ai pu mettre en place un service de fourniture de documents extérieurs à la médiathèque. Des ouvrages peuvent désormais être acheminés vers la médiathèque pour des usagers ou bien à destination des bibliothèques anglaises."

11.2. Numérisation en mode texte et en mode image

La numérisation du document imprimé, c'est-à-dire sa conversion sous une forme chiffrée binaire, peut être effectuée soit en mode texte, soit en mode image.

La numérisation en mode texte consiste à scanner le livre puis à contrôler le résultat à l'écran en relisant le tout. Les documents originaux manquant de clarté - certains livres anciens par exemple - sont saisis ligne après ligne. Ce mode de numérisation est long, et la notion de livre ou de page n'est pas conservée, puisque le texte apparaît en continu à l'écran. Cette méthode est nettement plus coûteuse que la numérisation en mode image, mais très préférable, puisqu'elle permet la recherche textuelle, l'indexation, les recherches séquentielles, les analyses, les comparaisons, etc. C'est la méthode utilisée par le Projet Gutenberg (11.1.1), la Bibliothèque électronique de Lisieux (11.1.3), et bien d'autres.

La numérisation en mode image correspond à la "photographie" du livre page après page. La notion de livre est conservée. La version informatique est en quelque sorte le fac-similé de la version imprimée. On peut donc "feuilleter" le texte page après page sur l'écran. C'est la méthode employée pour les numérisations à grande échelle, par exemple pour la constitution de Gallica, bibliothèque numérique de la Bibliothèque nationale de France (BnF). Même si, pour des raisons de coût, la BnF a choisi la numérisation en mode image, elle utilise le mode texte pour les tables des matières, les sommaires et les légendes des corpus iconographiques, afin de faciliter la recherche plein-texte. Pourquoi ne pas tout numériser en mode texte ? La BnF répond sur le site de Gallica: "Le mode image conserve l'aspect initial de l'original y compris ses éléments non textuels. Si le mode texte autorise des recherches riches et précises dans un document et permet une réduction significatice du volume des fichiers manipulés, sa réalisation, soit par saisie soit par OCR (optical character recognition), implique des coûts de traitement environ 10 fois supérieurs à la simple numérisation. Ces techniques parfaitement envisageables pour des volumes limités ne pouvaient ici être économiquement justifiables au vu des 35.000 documents (représentant presque 15 millions de pages) mis en ligne."

Selon Pierre Schweitzer, l'architecte designer qui a conçu @folio, support numérique de lecture nomade, "le mode image permet d'avancer vite et à très faible coût. C'est important car la tâche de numérisation du domaine public est immense. Il faut tenir compte aussi des différentes éditions: la numérisation du patrimoine a pour but de faciliter l'accès aux oeuvres, il serait paradoxal qu'elle aboutisse à focaliser sur une édition et à abandonner l'accès aux autres. Chacun des deux modes de numérisation s'applique de préférence à un type de document, ancien et fragile ou plus récent, libre de droit ou non (pour l'auteur ou pour l'édition), abondamment illustré ou pas. Les deux modes ont aussi des statuts assez différents: en mode texte ça peut être une nouvelle édition d'une oeuvre, en mode image c'est une sorte d''édition d'édition', grâce à un de ses exemplaires (qui fonctionne alors comme une fonte d'imprimerie pour du papier: une trace optique sur un support, numérique, c'est assez joli à réaliser). En pratique, le choix dépend bien sûr de la nature du fonds à numériser, des moyens et des buts à atteindre. Difficile de se passer d'une des deux façons de faire."

L'équipe d'@folio travaille notamment sur le logiciel Mot@Mot, une passerelle entre @folio (voir 8.1) et les fonds numérisés en mode image. "La plus grande partie du patrimoine écrit existant est fixé dans des livres, sur du papier, explique Pierre Schweitzer. Pour rendre ces oeuvres accessibles sur la toile, la numérisation en mode image est un moyen très efficace. Le projet Gallica en est la preuve. Mais il reste le problème de l'adaptation des fac-similés d'origine à nos écrans de lecture aujourd'hui: réduits brutalement à la taille d'un écran, les fac-similés deviennent illisibles. Sauf à manipuler les barres d'ascenseur, ce qui nécessite un ordinateur et ne permet pas une lecture confortable. La solution proposée par Mot@mot consiste à découper le livre, mot à mot, du début à la fin (enfin, les pages scannées du livre…). Ces mots restent donc des images, il n'y a pas de reconnaissance de caractères, donc pas d'erreur possible. On obtient une chaîne d'images-mots liquide, qu'on peut remettre en page aussi facilement qu'une chaîne de caractères. Il devient alors possible de l'adapter à un écran de taille modeste, sans rien perdre de la lisibilité du texte. La typographie d'origine est conservée, les illustrations aussi."

11.3. Les bibliothèques traditionnelles sont-elles menacées?

Face à un web encyclopédique et des bibliothèques numériques de plus en plus nombreuses, les jours des bibliothèques traditionnelles sont-ils comptés? Ou bien, au contraire, l'internet joue-t-il un rôle de catalyseur pour les relancer?