En juillet 1999, 370 oeuvres sont disponibles en ligne. A la même date, Olivier Bogros explique: «Les oeuvres à diffuser sont choisies à partir d’exemplaires conservés à la Bibliothèque municipale de Lisieux ou dans des collections particulières mises à disposition. Les textes sont saisis au clavier et relus par du personnel de la bibliothèque, puis mis en ligne après encodage. La mise à jour est mensuelle (3 à 6 textes nouveaux). Par goût, mais aussi contraints par le mode de production, nous sélectionnons plutôt des textes courts (nouvelles, brochures, tirés à part de revues, articles de journaux…). De même nous laissons à d’autres (bibliothèques ou éditeurs) le soin de mettre en ligne les grands classiques de la littérature française, préférant consacrer le peu de temps et de moyens dont nous disposons à mettre en ligne des textes excentriques et improbables. (…) Nous réfléchissons aussi, dans le domaine patrimonial, à un prolongement du site actuel vers les arts du livre - illustration, typographie… - toujours à partir de notre fonds. Sinon, pour ce qui est des textes, nous allons vers un élargissement de la part réservée au fonds normand.»

L’année 2000 marque le début du partenariat de la Bibliothèque électronique de Lisieux avec l’Université de Toronto. Lancé officiellement en août 2000, LexoTor est une base de données utilisant le logiciel TACTweb (TACT: text analysis computing tools) et permettant l’interrogation en ligne des oeuvres de la bibliothèque, ainsi que des analyses et des comparaisons textuelles. Le projet est issu de la rencontre d’Olivier Bogros avec Russon Wooldridge, professeur au département d’études françaises de l’Université de Toronto, lors d'un colloque organisé par ce dernier en mai 2000 à Toronto («colloque international sur les études françaises valorisées par les nouvelles technologies d’information et de communication»). Deux ans après, en mai 2002, un deuxième colloque international sur le même sujet est organisé cette fois par Olivier Bogros à Lisieux.

En septembre 2003, la bibliothèque électronique approche les 600 textes. En décembre 2006, les collections comprennent 930 oeuvres et 20 galeries d'images, le tout représentant 327,1 Mo (mégaoctets) sur une capacité de stockage de 600 Mo.

= Gallica

Secteur numérique de la Bibliothèque nationale de France (BnF), Gallica est inauguré en 1997 avec des images et textes du 19e siècle francophone, «siècle de l’édition et de la presse moderne, siècle du roman mais aussi des grandes synthèses historiques et philosophiques, siècle scientifique et technique». A l’époque, le serveur stocke 2.500 livres numérisés en mode image complétés par les 250 volumes numérisés en mode texte de la base Frantext de l’INaLF (Institut national de la langue française). Classées par discipline, ces ressources sont complétées par une chronologie du 19e siècle et des synthèses sur les grands courants en histoire, sciences politiques, droit, économie, littérature, philosophie, sciences et histoire des sciences. Le site propose aussi un échantillon de la future iconothèque numérique, à savoir le fonds du photographe Eugène Atget, une sélection de documents sur l’écrivain Pierre Loti, une collection d’images de l’Ecole nationale des ponts et chaussées sur les grands travaux liés à la révolution industrielle en France, et enfin un choix de livres illustrés de la Bibliothèque du Musée de l’homme.

Fin 1997, Gallica se considère moins comme une banque de données numérisées que comme un «laboratoire dont l’objet est d’évaluer les conditions d’accès et de consultation à distance des documents numériques». Le but est d’expérimenter la navigation dans ces collections, en permettant aussi bien le libre parcours du chercheur ou du curieux que des recherches textuelles pointues.

Début 1998, Gallica annonce 100.000 volumes et 300.000 images pour la fin 1999, avec un accroissement rapide des collections ensuite. Ces collections numériques pourront également être consultées sur place à la BnF au moyen de 3.000 postes multimédias, dont quelques centaines fonctionnent déjà début 1998. Sur les 100.000 volumes prévus, qui représenteront 30 millions de pages numérisées, plus du tiers concerne le 19e siècle. Quant aux 300.000 images fixes, la moitié appartient aux départements spécialisés de la BnF (Estampes et photographie, Manuscrits, Arts du spectacle, Monnaies et médailles, etc.). L’autre moitié provient de collections d’établissements publics (musées et bibliothèques, Documentation française, Ecole nationale des ponts et chaussées, Institut Pasteur, Observatoire de Paris, etc.) ou privés (agences de presse dont Magnum, l’Agence France-Presse, Sygma, Rapho, etc.).

Par ailleurs, à la même date, le site bilingue français-anglais de la BnF est à la fois solidement ancré dans le passé et résolument ouvert sur l’avenir, comme en témoigne le menu principal de la page d’accueil avec ses neuf rubriques: nouveau (à savoir les nouvelles manifestations culturelles), connaître la BnF, les actualités culturelles, les expositions virtuelles (quatre expositions en septembre 1998: les splendeurs persanes, le roi Charles V et son temps, naissance de la culture française, tous les savoirs du monde), des informations pratiques, l’accès aux catalogues de la BnF, l’information professionnelle (conservation, dépôt légal, produits bibliographiques, etc.), la bibliothèque en réseau (Francophonie, coopération nationale, coopération internationale, etc.), et les autres serveurs (bibliothèques nationales, bibliothèques françaises, universités, etc.). Enfin, bien en vue sur la page d’accueil, un logo permet d’accéder à Gallica.

En mai 1998, la BnF revoit ses espérances à la baisse et modifie quelque peu ses orientations premières. Jérôme Strazzulla, journaliste, écrit dans Le Figaro du 3 juin 1998 que la BnF est «passée d’une espérance universaliste, encyclopédique, à la nécessité de choix éditoriaux pointus». Dans le même article, le président de la BnF, Jean-Pierre Angremy, rapporte la décision du comité éditorial de Gallica: «Nous avons décidé d’abandonner l’idée d’un vaste corpus encyclopédique de cent mille livres, auquel on pourrait sans cesse reprocher des trous. Nous nous orientons aujourd’hui vers des corpus thématiques, aussi complets que possibles, mais plus restreints. (…) Nous cherchons à répondre, en priorité, aux demandes des chercheurs et des lecteurs.» Le premier corpus aura trait aux voyages en France, avec mise en ligne prévue en 2000. Ce corpus rassemblera des textes, estampes et photographies du 16e siècle à 1920. Les corpus envisagés ensuite sont : Paris, les voyages en Afrique des origines à 1920, les utopies, et les mémoires des Académies des sciences de province.

En 2003, Gallica donne accès à tous les documents libres de droit du fonds numérisé de la BnF, à savoir 70.000 ouvrages et 80.000 images allant du Moyen-Age au début du 20e siècle. Mais, de l’avis de nombreux usagers, les fichiers sont très lourds puisque les livres sont numérisés en mode image, et l’accès en est très long. Chose tout aussi problématique, la numérisation en mode image n’autorise pas la recherche textuelle alors que Gallica se trouve être la plus grande bibliothèque numérique francophone du réseau en nombre de titres disponibles en ligne. Seule une petite collection de livres (1.117 titres en février 2004) est numérisée en mode texte.