Le colloque intitulé La numérisation des textes et des images : techniques et réalisations s’est tenu les 16 et 17 janvier 2003 à l’Université Lille III. Organisées par le service commun de la documentation et le CRHEN-O (Centre de recherche sur l’histoire de l’Europe du nord-ouest) et soutenues par le service de la recherche, ces deux journées ont réuni près de 200 professionnels : bibliothécaires, archivistes, documentalistes, prestataires mais aussi chercheurs, sur des sujets résolument très techniques. Impliquées dans un projet de bibliothèque numérique en histoire régionale (NordNum), nous sommes parties du constat que la documentation technique sur les divers projets en cours circulait très peu et que de nombreux chefs de projet étaient confrontés aux mêmes problématiques méthodologiques et techniques.
Les interventions
Conçus autour de plusieurs grands thèmes, ces deux jours ont abordé, dans un premier temps, la numérisation des textes avec la présentation de plusieurs projets : le CNUM, Bibliothèque numérique du CNAM (G. Deblock), NordNum (I. Westeel, Université Lille III), le Journal du chevalier de Corberon (D. Taurisson, Shadyc, EHESS-CNRS, Marseille), Medic@ (H. Ferreira-Lopes, BIUM Paris V). Les problèmes techniques ont ensuite occupé l’après-midi de la première journée avec un exposé sur le problème central que constituent les aspects juridiques. L’intervention d’I. de Lamberterie (CECOJI-CNRS) a suscité de nombreuses et nouvelles interrogations. Il fut ensuite question de normes, de formats, d’encodage avec BiblioML (M. Bottin, Ministère de la culture), l’EAD (F. Queyroux, Bibliothèque de l’Institut), les formats relatifs aux images (E. Fernandez, Archives de France), la reconnaissance dans les images numérisées avec en particulier les problèmes d’OCR (Y. Leydier, F. Lebourgeois, H. Emptoz, INSA Lyon). La seconde journée a débuté avec la démonstration de banques de données images. Furent ainsi présentés le CD-ROM « Cantor et Musicus » (M. Vial, Bibliothèque interuniversitaire de médecine de Montpellier), la numérisation aux archives de Douai (V. Doom), le projet Libris, une banque d’images régionales (M. Aubry, CRHEN-O Lille III), le Liber Floridus, base des enluminures des manuscrits médiévaux des bibliothèques d’enseignement supérieur (V. Néouze, sous-direction des bibliothèques et de la documentation). Enfin l’après-midi du vendredi fut consacré aux problèmes de coopération et de collaboration entre les entreprises de numérisation en cours ou à venir avec une intervention de F. Vidal (GEODE UMR 5602 CNRS Toulouse) sur le projet Im@doc, réseau s’appuyant sur celui des MSH et proposant un travail coopératif dans le domaine des sciences humaines et sociales. M. Sévigny (AJLSM, Bordeaux) intervint ensuite sur les problèmes posés par la mise en place d’un système d’information documentaire. La table ronde finale réunit enfin des représentants des différents acteurs d’un projet de numérisation : bibliothèques, archives, chercheurs, informaticiens, prestataires avec la participation de K. Brzustowski (ABES), P. Cubaud (CNAM), H. Emptoz (INSA), M.de Ferrière (Lille III), C. Lupovici (BNF), O. Walbecq (Archimed).
Brun-Lavainne, Atlas topographique et historique de la ville de Lille. Lille, Lefort, 1830. Pl. XXXII. Le Pont Neuf
Centre de recherche sur l’histoire de l’Europe du nord-ouest
Structuration et coopération
Après quelques années de tâtonnements et d’essais dans la conception des projets, il est temps de passer à une phase de structuration c’est-à-dire à une pratique plus généralisée des formes de collaboration. Le passage par cette nouvelle étape pourra garantir et permettre une interopérabilité avec d’autres projets nationaux et internationaux. Dans ce contexte, l’utilisation des normes et standards est indispensable.
Utilisation de normes
Les interventions et les discussions ont montré ainsi la nécessité de travailler sur des normes (ou des quasi-normes) et des standards reconnus. Des outils très prometteurs existent désormais : EAD, Biblio-ML… Quelques exemples : Biblio-ML permet d’intégrer dans une notice bibliographique des éléments tels que tables des matières et index de l’ouvrage ; EAD est un standard tout à fait compatible avec les formats MARC et l’encodage d’un document sous cette DTD permet d’intégrer des ressources numériques. Diverses possibilités techniques ainsi que des logiciels libres sont désormais abordables.
L’utilisation plus fréquente de la zone 856 dans les catalogues collectifs, en particulier le Sudoc, permettrait de donner une meilleure visibilité aux entreprises de numérisation.
Information et formation
L’intérêt qu’ont suscité ces rencontres, le nombre et la diversité des participants montrent clairement le besoin énorme en information et en formation dans ces domaines. Après l’organisation de formations plutôt théoriques ces dernières années, il devient urgent d’organiser à plus grande échelle des sessions de formations très pratiques qui permettraient aux professionnels de mieux comprendre et d’appréhender les différents outils nécessaires à la mise en place de bibliothèques numériques : par exemple définition concrète d’une DTD, paramétrage d’un éditeur XML, préparation de feuilles de style…
Aide à la recherche
Le but de ces entreprises est la mise à disposition à distance du patrimoine présent dans les dépôts et institutions. Une diffusion améliorée et une meilleure visibilité des ressources par la mise en place d’instruments communs (portails, passerelles…) sont demandées par la communauté scientifique et c’est ce que permettra la coopération évoquée plus haut. D’autres centres de recherche et laboratoires travaillent encore plus avant en mettant en place des programmes d’édition électronique. Plusieurs universités, dont Lille III, travaillent dans ce sens. La question de la diffusion de ces nombreux fichiers d’images est en effet indissociable des projets d’édition électronique courante puisque les réservoirs rétrospectifs vont inévitablement se tarir. Les perspectives dans ce domaine sont aujourd’hui l’objet d’autres débats et rencontres mais les deux sujets sont intimement liés, le but étant de simplifier et d’enrichir le travail des chercheurs.