[En détail]
Secteur numérique de la Bibliothèque nationale de France (BnF), Gallica est inauguré en octobre 1997 avec des textes et images du 19e siècle francophone, le 19e siècle étant le "siècle de l’édition et de la presse moderne, siècle du roman mais aussi des grandes synthèses historiques et philosophiques, siècle scientifique et technique" (extrait du site web). A l’époque, le serveur stocke 2.500 livres numérisés en mode image complétés par les 250 volumes numérisés en mode texte de la base Frantext de l’INaLF (Institut national de la langue française). Classées par discipline, ces ressources sont complétées par une chronologie du 19e siècle et une synthèse sur les grands courants en histoire, sciences politiques, droit, économie, littérature, philosophie, sciences et histoire des sciences. Le site propose aussi un échantillon de la future iconothèque numérique, à savoir le fonds du photographe Eugène Atget, une sélection de documents sur l’écrivain Pierre Loti, une collection d’images de l’Ecole nationale des ponts et chaussées sur les grands travaux liés à la révolution industrielle en France, et enfin un choix de livres illustrés de la Bibliothèque du Musée de l’Homme.
Gallica se considère moins comme une banque de données numérisées que comme un "laboratoire dont l’objet est d’évaluer les conditions d’accès et de consultation à distance des documents numériques", lit-on sur le site web à la fin de 1997. Le but est d’expérimenter la navigation dans ces collections, en permettant aussi bien le libre parcours du chercheur ou du curieux que des recherches pointues.
Début 1998, Gallica annonce 100.000 volumes et 300.000 images pour la fin 1999, avec un accroissement rapide des collections ensuite. Sur les 100.000 volumes prévus, qui représenteront 30 millions de pages numérisées, plus du tiers concerne le 19e siècle. Quant aux 300.000 images fixes, la moitié appartient aux départements spécialisés de la BnF (Estampes et photographie, Manuscrits, Arts du spectacle, Monnaies et médailles, etc.). L’autre moitié provient de collections d’établissements publics (musées et bibliothèques, Documentation française, Ecole nationale des ponts et chaussées, Institut Pasteur, Observatoire de Paris, etc.) ou privés (agences de presse dont Magnum, l’Agence France-Presse, Sygma, Rapho, etc.).
En mai 1998, Gallica revoit ses espérances à la baisse et modifie quelque peu ses orientations premières. Dans un article du quotidien Le Figaro du 3 juin 1998, Jérôme Strazzulla, journaliste, écrit que la BnF est "passée d’une espérance universaliste, encyclopédique, à la nécessité de choix éditoriaux pointus". Dans le même article, il interviewe le président de la BnF, Jean-Pierre Angremy, qui rapporte la décision du comité éditorial de Gallica: "Nous avons décidé d’abandonner l’idée d’un vaste corpus encyclopédique de cent mille livres, auquel on pourrait sans cesse reprocher des trous. Nous nous orientons aujourd’hui vers des corpus thématiques, aussi complets que possibles, mais plus restreints. (…) Nous cherchons à répondre, en priorité, aux demandes des chercheurs et des lecteurs." Le premier corpus aurait trait aux voyages en France, avec mise en ligne prévue en 2000. Ce corpus rassemblerait des textes, estampes et photographies du 16e siècle à 1920. Les corpus envisagés ensuite auront les thèmes suivants: Paris, les voyages en Afrique des origines à 1920, les utopies, et les mémoires des Académies des sciences de province.
En 2003, Gallica donne accès à tous les documents libres de droit du fonds numérisé de la BnF, à savoir 70.000 ouvrages et 80.000 images allant du Moyen-Age au début du 20e siècle. Mais, de l’avis de nombreux usagers, les fichiers sont très lourds puisque les livres sont numérisés en mode image, et l’accès en est très long. Chose tout aussi problématique, la numérisation en mode image n’autorise pas la recherche textuelle alors que Gallica se trouve être la plus grande bibliothèque numérique francophone en nombre de titres disponibles en ligne. Seule une petite collection de livres (1.117 titres en février 2004) est numérisée en mode texte, celle de la base Frantext de l'ATILF (Analyse et traitement informatique de la langue française, le laboratoire ayant succédé à l'INaLF), intégrée dans Gallica.
En février 2005, Gallica compte 76.000 ouvrages. A la même date, la BnF annonce la mise en ligne prochaine (entre 2006 et 2009) de la presse française parue entre 1826 et 1944, à savoir 22 titres représentant 3,5 millions de pages. Début 2006, les premiers journaux disponibles en ligne sont Le Figaro (fondé en 1826), La Croix (fondée en 1883), L'Humanité (fondée en 1904) et Le Temps (fondé en 1861 et disparu en 1942). En décembre 2006, les collections comprennent 90.000 ouvrages numérisés (fascicules de presse compris), 80.000 images et des dizaines d'heures de ressources sonores. Gallica débute aussi la conversion en mode texte des livres numérisés en mode image pour pour favoriser l'accès à leur contenu.
1998: BIBLIOTHECAIRES NUMERIQUES
[Résumé]
En 1998, Peter Raggett est sous-directeur (puis directeur) de la Bibliothèque centrale de l'OCDE (Organisation de coopération et de développement économiques). Il explique en juin 1998: "L’internet offre aux chercheurs un stock d’informations considérable. (…) A mon avis, les bibliothécaires auront un rôle important à jouer pour améliorer la recherche et l’organisation de l’information sur le réseau. Je prévois aussi une forte expansion de l’internet pour l’enseignement et la recherche. Les bibliothèques seront amenées à créer des bibliothèques numériques permettant à un étudiant de suivre un cours proposé par une institution à l’autre bout du monde. La tâche du bibliothécaire sera de filtrer les informations pour le public. Personnellement, je me vois de plus en plus devenir un bibliothécaire virtuel. Je n’aurai pas l’occasion de rencontrer les usagers, ils me contacteront plutôt par courriel, par téléphone ou par fax, j’effectuerai la recherche et je leur enverrai les résultats par voie électronique."