= Collection numérique et bibliothèque numérique
La bibliothèque numérique peut être définie comme une entité résultant de l’utilisation des technologies numériques pour acquérir, stocker, préserver et diffuser des documents. Ces documents sont soit publiés directement sous forme numérique, soit numérisés à partir d’un document imprimé, audiovisuel ou autre. Une collection numérique devient une bibliothèque numérique quand elle répond aux quatre facteurs suivants: 1) elle peut être créée et produite dans un certain nombre d’endroits différents, mais elle est accessible en tant qu’entité unique; 2) elle doit être organisée et indexée pour un accès aussi facile que possible à partir du lieu de base où elle est produite; 3) elle doit être stockée et gérée de manière à avoir une existence assez longue après sa création; 4) elle doit trouver un équilibre entre le respect du droit d’auteur et les exigences universitaires.
Dans Information Systems Strategy, un document disponible sur le site de la British Library en 1997, Brian Lang, directeur de projet, explique que la future bibliothèque numérique de la British Library n’est pas envisagée comme un secteur à part, mais qu’elle fera partie intégrante d’une vision globale de la bibliothèque. Si certaines bibliothèques pensent que les documents numériques prédomineront dans les bibliothèques du futur, la British Library n’envisage pas une bibliothèque exclusivement numérique. Elle considère comme fondamentale la communication physique des imprimés, manuscrits, partitions musicales, bandes sonores, etc., tout en ayant conscience de la nécessité du développement parallèle de collections numériques. "On ne peut pas, on ne pourra pas tout numériser. A terme, une bibliothèque virtuelle ne sera jamais qu’un élément de l’ensemble bibliothèque", souligne aussi Jean-Pierre Angremy, président de la Bibliothèque nationale de France (BnF), dans un article du Figaro du 3 juin 1998.
Hébergée par l'Université Carnegie Mellon (Pittsburgh, Pennsylvanie, Etats-Unis) et reliée au catalogue expérimental (Experimental Search System - ESS) de la Library of Congress, l’Universal Library insiste sur les trois avantages de la bibliothèque numérique: 1) elle occupe moins de place qu’une bibliothèque traditionnelle et son contenu peut être copié ou sauvegardé électroniquement; 2) elle est immédiatement accessible à quiconque sur l’internet; 3) comme toute recherche sur son contenu est automatisée, elle permet une réduction des coûts importante et une plus grande accessibilité des documents.
= Numérisation en mode image et en mode texte
Qui dit bibliothèque numérique dit numérisation, c’est-à-dire conversion des textes et des images en langage informatique, le plus souvent binaire (0 ou 1). Pour pouvoir être consulté à l’écran, un livre doit être numérisé soit en mode image soit en mode texte.
La numérisation en mode image correspond à la photographie du livre page après page. C’est la méthode employée pour les numérisations à grande échelle, par exemple pour le programme de numérisation de la Bibliothèque nationale de France (BnF). Outre un coût peu élevé, l’avantage qu’y voient les bibliothèques est la conservation de la notion de livre, puisque la version informatique est le fac-similé de la version imprimée.
La numérisation en mode texte implique la saisie d’un texte. Les documents sont patiemment scannés ou saisis page après page. C’est le cas des collections d’ABU: la bibliothèque universelle ou du Projet Gutenberg. Contrairement à la numérisation en mode image, la version informatique ne conserve pas la présentation originale du livre ou de la page. Le livre devient texte, à savoir un ensemble de caractères apparaissant en continu à l’écran. A cause du temps passé au traitement de chaque livre, ce mode de numérisation est assez long, et donc nettement plus coûteux que la numérisation en mode image. Dans de nombreux cas, il est toutefois très préférable, puisqu’il permet l’indexation, la recherche et l’analyse textuelles, une étude comparative entre plusieurs textes ou entre plusieurs versions du même texte, etc.
Même si, pour des raisons de coût, le texte est numérisé en mode image, la numérisation en mode texte est souvent utilisée pour les tables des matières, les sommaires et les corpus de documents iconographiques. C'est la solution choisie par Gallica, bibliothèque numérique de la BnF (Bibliothèque nationale de France).
= Le Projet Gutenberg