Numériser ses livres anciens facilement et pour pas cher


Scanner à livres
Crédit photo : Book scanning by Daniel Reetz – CC

Comment faire quand on n’a pas les moyens de Google ou de la Bnf pour scanner des milliers de livres avec un matériel perfectionné ? Avec les moyens du bord ! Sans dépenser des milliers d’euros ? Oui c’est possible.

Petite précision : cet article n’est pas destiné à un professionnel mais à l’amateur ou à l’amatrice intéressé(e) par la numérisation des livres. Les professionnels peuvent aller plutôt sur la page consacrée à la numérisation sur le site de la Bnf.

Tout le monde connaît sûrement le classique scanner à plat (souvent couplé aujourd’hui avec une imprimante ou un photocopieur) qui permet de transformer une image en fichier informatique (numérique) en effectuant un balayage du document. Mais utiliser un scanner à plat pour un livre ancien est fortement déconseillé et cela vous prendra des heures. Il existe une autre solution qui consiste à effectuer une numérisation par prise de vue photographique. Un appareil photo numérique photographie le document page par page.  Deux types de machines sont utilisées aujourd’hui : une machine permettant une numérisation à plat et  « une machine avec berceau en forme de V pour les documents fragiles composé d’un appareil photographique en face de chaque versant et éventuellement d’un robot tourne-page limitant l’intervention d’un opérateur (source Bnf). » Celle qui nous intéresse ici.

Ces machines sont proposées à un prix fort élevé mais rien ne vous empêche de la réaliser vous-même. Daniel Reetz propose ainsi de construire un scanner de livres avec une boîte en carton, une plaque de verre, un trépied, une lampe  et un appareil photo numérique (photo ci-dessus).  D’autres solutions sont proposées par Emmanuel Barthe sur le blog « Un blog pour l’information juridique ». Pour ceux qui sont moins bricoleurs ou qui veulent quelque chose de plus durable,  vous avez l’excellent DIY Book Scanner (« scanner à livre à faire par vous-même »), un scanner à livres que l’on peut acheter en kit de base pour 549 €, livraison comprise. Le tout est basé sur des logiciels libres pour le scan. Il ne faudra pas oublier d’avoir un ordinateur à portée de main pour réussir votre numérisation. Il ne vous restera plus qu’à proposer vos livres numérisés (du domaine public) sur un site comme Archive.org et en faire bénéficier les internautes. Si vous avez du mal avec l’anglais, le site Un BookScanner à Paris vous sera utile. Vous pouvez également lire l’article paru sur ActuaLitté qui évoque le BookScanner.

Enfin n’oubliez pas de faire attention aux points suivants :

– La résolution de l’image

Plus la définition de l’image est importante plus son poids sera grand et sa qualité meilleure. Pour l’impression la définition de l’image doit être d’au moins 300 ppp (point par pouce).

– le traitement de l’image :

Pour redresser une image, l’améliorer… utilisez un logiciel de retouche d’image comme Gimp (gratuit).

– la reconnaissance du texte (OCR)

Si vous scannez du texte il vous faudra un logiciel qui permet de transformer un fichier contenant l’image d’un document en fichier texte (indispensable pour une recherche plein texte).

– l’enrichissement des métadonnées (pour professionnels)

Pour faire simple, les métadonnées ce sont des informations sur un document (données servant à décrire d’autres données). On distingue les métadonnées d’identification et de description (auteur, titre, pagination, éditeur…) et les métadonnées de production portant sur l’aspect technique (résolution, format, date de création…) de la numérisation et l’historique de la numérisation (étapes, prestataire).

– les formats de sauvegarde et de diffusion

La Bnf écrit que « le choix du format est essentiel à la qualité de la numérisation et à la préservation à long terme des documents numériques. Il doit être le plus ouvert possible, autoriser l’indexation de chaque fichier, et, si la compression est choisie, celle-ci doit être sans perte ou réversible si l’on veut assurer la sauvegarde à long terme des images. »

Grosso modo le format d’archivage pour un imprimé ou une image est le TIFF et pour sa diffusion le PDF, le JPEG ou le TIFF. On peut proposer d’autres formats comme le fait Archive.org (ePUB, fichier texte…).

Terminons sur une note personnelle. Les documents numérisés sur BiblioMab ou sur Flickr sont au format JPEG, souvent de taille réduite. J’utilise un appareil photo numérique ancien mais efficace avec mode macro, le livre est posé à plat ou sur le fameux futon de consultation fait maison, une lampe de bureau au-dessus.

Léo Mabmacien

Publicités

11 réflexions au sujet de « Numériser ses livres anciens facilement et pour pas cher »

  1. Très bonne présentation… Ça me permettra d’améliorer ma méthode. Il y a un problème que je n’ai pas encore résolu: il est souvent difficile de maintenir un livre suffisamment ouvert pour qu’on puisse le photographier correctement, sans y mettre une main (ou deux)… Après la numérisation complète d’un livre, la reliure est souvent affaiblie ou brisée. Si possible, vaut mieux mettre la main sur un exemplaire défraîchi pour le numériser.
    Un avantage d’avoir des fichiers jpg est qu’on peut traiter les images pour obtenir un meilleur taux de réussite pour l’ocr: augmenter les contrastes, créer des fichiers noir/blanc ou en niveau de gris. Des logiciels comme Photoshop mais aussi Picasa (Google) permettent de modifier plusieurs images sélectionnées à la fois.
    Connaissez-vous de « bons » logiciels libres d’ocr en « open? Personnellement, j’utiise Omnipage. C’est un logiciel payant, mais très efficace et performant.

  2. Bonjour, j’ai trouvé votre site en cherchant des conseils pour numériser un ouvrage ancien : traité d’harmonie et de composition musicale, datant de la fin du 18ème ou début 19ème. Outre l’intérêt de préserver ce livre des outrages du temps, j’aurais besoin de l’utiliser à des fins didactiques, en transférant le contenu sur ordinateur.
    D’après les infos recueillies sur votre site, je pense que la bonne méthode est de photographier chaque page (hors de question de scanner à plat, bien sûr). N’ayant que mon téléphone portable en guise d’appareil, je suppose que la définition est insuffisante. Que me conseillez-vous comme appareil? 5, 10 Mpx ou.. plus? et avec quel objectif? Un achat est-il obligatoire, ou peut-on en louer de bonne qualité optique pour une courte durée (250 pages, ce devrait être vite fait…)

  3. Bonjour,

    Un simple appareil numérique suffit. Il faut juste sélectionner la fonction macro et avoir un éclairage correct.

    Cordialement
    Léo

  4. Bonjour & merci pour cet article instructif ; je souhaiterai numériser pour mon usage personnel des livres plutôt usagés en grec ancien de ma médiathèque (ce qui est légal il me semble); je dispose d’un pc avec scanner Epson perfection V33 & d’un smartphone LG G4 16MP F 1.8 et j’hésite entre ces deux appareils pour la numérisation…je souhaiterai créer des fichiers consultables sur une liseuse numérique pour malvoyants (avec possibilité d’augmenter la taille des lettres ou de convertir les textes en fichier audio pour « lire » les livres ; je ne sais pas si ça existe). Si vous avez des réponses à ces questions ou si vous connaissez un forum public où je pourrai me renseigner, merci d’avance 😊

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s