La numérisation est la codification d’informations (textes, images, sons) en langage généralement binaire (0 ou 1) pour permettre leur traitement par voie informatique. La numérisation permet la création, l’enregistrement, la combinaison, le stockage, la recherche et la transmission de documents de manière simple et rapide. Des procédés similaires permettent le traitement du texte, du son et de l’image alors que, par le passé, ce traitement était assuré par des procédés différents et sur des supports différents (le papier pour l’écriture, la bande magnétique pour la musique, le celluloïd pour le cinéma). En ce qui concerne les livres, la numérisation peut être effectuée soit en mode texte, soit en mode image. [Voir aussi: numérique, numérisation en mode image, numérisation en mode texte.]

= numérisation en mode image =

Contrairement à la numérisation en mode texte, qui propose le texte d'un livre en continu, la numérisation en mode image correspond à la photographie du livre. La version informatique est le fac-similé numérique de la version imprimée. La présentation originale étant conservée, on peut feuilleter le texte page après page à l’écran. C’est la méthode employée pour les numérisations à grande échelle, par exemple pour la constitution de Gallica, la bibliothèque numérique de la Bibliothèque nationale de France (BnF). Dans le cas de Gallica, pour faciliter la recherche textuelle, les tables des matières, les sommaires et les légendes des corpus iconographiques sont numérisés en mode texte. [Voir aussi: bibliothèque numérique, Gallica, numérisation, numérisation en mode texte.]

= numérisation en mode texte =

Deux méthodes sont possibles pour numériser un livre en mode texte. On peut saisir le livre de bout en bout sur le clavier de son ordinateur. On peut aussi scanner le livre page après page, ce qui donne des fichiers numérisés en mode image, puis on utilise un logiciel OCR (optical character recognition), qui permet de convertir chaque fichier image en fichier texte. Il est ensuite préférable de relire le contenu du fichier texte au regard de l’original (image scannée ou livre imprimé) en corrigeant les erreurs (dix erreurs par page en moyenne lorsque le logiciel OCR est de qualité). Dans l’un comme l’autre cas (saisie ou scannage + OCR), le texte numérisé apparaît en continu à l’écran, et la présentation de la page originale n’est pas conservée. A cause du temps passé au traitement de chaque livre, la numérisation en mode texte est assez longue. Elle est toutefois très préférable à la numérisation en mode image, puisqu’elle permet l’indexation, la recherche plein texte, l’analyse textuelle, une étude comparative entre plusieurs textes ou plusieurs versions du même texte, etc. C’est la méthode utilisée par exemple par le Projet Gutenberg, la grande bibliothèque mondiale au format texte fondée en 1971. Le format de fichier obtenu est le format TXT, et l'extension du fichier est ".txt". [Voir aussi: bibliothèque numérique, indexation, numérisation, numérisation en mode image, OCR, Projet Gutenberg, scanner, TXT.]

= numériseur =

Un numériseur est un appareil permettant de convertir des informations analogiques (textes, images, sons) en valeurs numériques (0 et 1) manipulables sur ordinateur. Il existe différents types de numériseurs: les scanners (numériseurs à balayage), les tablettes à numériser, les caméras haute définition, les magnétophones numériques et les magnétoscopes numériques. [Voir aussi: analogique, numérique, scanner.]

= Numilog =

Créée par Denis Zwirn en mars 2000, la société Numilog est spécialisée dans la fabrication et la distribution de livres numériques. Numilog lance une librairie en ligne en octobre 2000. En 2003, le catalogue comprend 3.500 titres (incluant les numéros de revues) en français et en anglais, aux formats PDF (portable document format, lisible par l'Adobe Reader), LIT (abrégé du terme anglais "literature", lisible par le Microsoft Reader) et PRC (Palm resource, lisible par le Mobipocket Reader), grâce à un partenariat avec une quarantaine d'éditeurs. Numilog devient la principale librairie francophone de livres numériques, suite à des accords avec de nombreux éditeurs (Gallimard, Albin Michel, Eyrolles, Hermès Science, Pearson Education France, etc.). Numilog propose aussi des livres audio. Une librairie anglophone est lancée suite à des accords de diffusion conclus avec plusieurs éditeurs anglo-saxons (Springer-Kluwer, Oxford University Press, Taylor & Francis, Kogan Page, etc.). Les livres numériques sont proposés dans différents formats permettant leur lecture sur tout appareil électronique (ordinateur, assistant personnel, téléphone portable, smartphone, etc.). Numilog propose aussi un système de bibliothèque en ligne (permettant de prêter des livres numériques) destiné aux bibliothèques, aux administrations et aux entreprises. Numilog est également prestataire de services pour les technologies DRM (digital rights management). En janvier 2006, Numilog met sur pied la plateforme de la Bibliothèque numérique pour le Handicap (BNH), une initiative de la ville de Boulogne-Billancourt (région parisienne). En décembre 2006, le catalogue de Numilog comprend 35.000 livres numériques et 200 éditeurs partenaires, dont 60 éditeurs francophones. [Voir aussi: bibliothèque numérique, Bibliothèque numérique pour le Handicap, DRM, éditeur, librairie numérique, LIT, livre audio, livre numérique, PDF, PRC, smartphone, téléphone portable, Zwirn Denis.]

= NuvoMedia =