Parallèlement, dans le contexte du Programme des bibliothèques lancé par l'Union européenne, l'accent a été mis en 1996 sur l'utilisation du format UNIMARC comme format commun d'échange entre tous les formats MARC utilisés par les bibliothèques européennes. Le groupe de travail constitué a étudié aussi les problèmes posés par les différentes polices de caractères, ainsi que la relation entre le format bibliographique et le format du document quand celui-ci sera disponible en ligne.
Certains préconisent l'utilisation de SGML (standard generalized markup language) comme format commun aux notices bibliographiques et aux documents hypertextuels et multimédias correspondants.
Comme la plupart des éditeurs stockent déjà des documents en format SGML, on songe à faire converger MARC et SGML. La Library of Congress a réalisé la DTD (definition of type of document, qui en définit la structure logique) pour le format USMARC, parce qu'elle sera sans doute de plus en plus amenée à vendre des données à la fois en SGML et en USMARC. Une DTD pour le format UNIMARC est également développée dans le cadre d'un projet de l'Union européenne. Dans son mémoire L'accès aux catalogues des bibliothèques par Internet, Thierry Samain mentionne l'adoption du format SGML par certaines bibliothèques pour encoder leurs données bibliographiques. Dans le catalogue collectif belge par exemple, l'utilisation de SGML permet d'ajouter des éléments descriptifs issus du format MARC et d'autres types de formats. Elle permet aussi de faciliter la production du CD-ROM annuel.
Dans Digital Literacy (New York, Wiley, 1997), Paul Gilster se demande si les moteurs de recherche d'Internet seront les catalogues de demain, ce qui n'est guère possible à l'heure actuelle: contrairement au système commun d'indexation propre aux bibliothèques américaines, chaque engin de recherche a sa propre méthode d'indexation, et l'usager doit se familiariser avec elle afin d'en tirer le meilleur parti.
Ceci dit, les remarques que fait Paul Gilster sur les engins de recherche d'Internet sont applicables aussi aux catalogues des bibliothèques vus à l'échelon mondial. Pour indexer leurs documents, un certain nombre de bibliothèques tentent d'harmoniser leurs mots-matière en utilisant par exemple ceux de la Library of Congress dans le monde anglophone ou ceux de RAMEAU (répertoire d'autorités matières encyclopédique et alphabétique unifié) ou de la Bibliothèque nationale du Canada dans le monde francophone. Malgré ces tentatives d'harmonisation, on ne compte pas le nombre de thésaurus utilisés de par le monde. Le meilleur test est une recherche par sujets dans le OCLC Union Library Catalog pour être persuadé du fait que l'absence d'un thésaurus universel est vraiment problématique.
Les bibliothèques auraient un gigantesque effort à fournir pour harmoniser leurs thésaurus ou leurs listes de mots-matière. En Europe, un thésaurus multilingue serait également indispensable, puisque chacun indexe en général ses publications dans sa propre langue. Le travail est titanesque. Puisque les bibliothèques et Internet sont destinés à collaborer étroitement, pourquoi ne pas envisager une liste multilingue commune à partir des meilleurs outils existant dans les deux domaines?
Un autre problème est celui de l'harmonisation des logiciels. En Europe, l'Union européenne a lancé le projet OPAC Network in Europe (ONE), pour un meilleur accès des OPAC (online public access catalogues) et des catalogues nationaux des bibliothèques européennes.
Réalisé entre janvier et décembre 1997, ONE a rassemblé 15 organismes dans 8 pays européens. Son objectif était de produire un logiciel permettant l'interaction entre les logiciels existants, de façon à n'avoir qu'un seul point d'accès par lequel les usagers d'un pays donné puissent se connecter aux catalogues des bibliothèques d'autres pays. Le but était à la fois d'encourager l'interconnexion entre les bibliothèques européennes pour une plus grande coopération et de résoudre les problèmes liés aux divers formats de notices et aux différentes polices de caractères. Le projet était également basé sur l'utilisation de protocoles internationaux comme la norme Z39.50.
Comme c'est eux qui, à terme, permettront l'accès au documents, les catalogues informatiques doivent être aussi parfaits que possible. On peut même rêver à des catalogues communs aux bibliothèques, aux librairies et aux éditeurs. Du fait de la rigueur et du professionnalisme qu'il implique, le catalogage est devenu un métier à part entière. La notice minimale: auteur, titre, éditeur fait maintenant place à une notice plus complexe régie par des normes internationales permettant un meilleur échange de données. Ce n'est d'ailleurs pas un hasard si la réputation d'une bibliothèque s'appuie en partie sur la qualité de son catalogue. Il est sa colonne vertébrale, et le sera de plus en plus avec le développement des cyberbibliothèques.