La base bibliographique du catalogue Sudoc (Système universitaire de documentation) a pour socle les catalogues collectifs précédents, mais aussi les notices de la bibliothèque universitaire du Mans, site pilote dans le lancement du Sudoc appelé dans le jargon ABES « bibliothèque hors sources ». Pourquoi donc ? parce que cette bibliothèque ne participait pas à un réseau de catalogage partagé. La reprise de ses données a été un test de faisabilité et a permis de voir que si une bibliothèque respectait le format national d’échange, ses notices pouvaient être intégrées dans le catalogue Sudoc. Il a donc été décidé, dans un premier temps, que chaque bibliothèque « hors sources » entrant dans le réseau bénéficierait de ce traitement. Dans le « premier cercle » de bibliothèques mises en réseau – soit les bibliothèques universitaires – 11 bibliothèques étaient concernées. Les versements se sont échelonnés depuis 2002 à ces derniers mois ; seule l’importation des bibliothèques dont le SIGB (système local de gestion de bibliothèque) est « AB6 » n’est pas encore terminée. Pour ces bibliothèques, la moyenne des notices fusionnées avec une notice identique déjà présente dans la base du Sudoc est de 74 % ! Il s’est avéré que certains fournisseurs de SIGB ont du mal à exporter des notices dans un format standard, UNIMARC ou Marc21, et les aller-retour pour obtenir des notices correctes sont longs. Les efforts à fournir, pour les bibliothèques et leurs fournisseurs, et pour l’ABES en diagnostic et adaptation des programmes de conversion, sont disproportionnés au vu des résultats – tant de travail pour des notices dont les trois quarts sont à fusionner, c’est dommage ! Forte de tous ces éléments, l’équipe « Données » de l’ABES a mis en place une procédure alternative plus légère de « création automatique d’exemplaires ».
Les fournisseurs n’ont à exporter qu’un fichier texte contenant des séparateurs (en l’occurrence « ; »). Dans ce fichier, soit l’ISBN, soit les éléments date/auteur/titre, servent de clé pour la recherche de la notice correspondante dans la base du Sudoc. Des données d’exemplaires sont incluses dans le fichier pour chaque document, et insérées dans les exemplaires créés. Un exemplaire est créé automatiquement si – et seulement si – une seule réponse est trouvée. Cette méthode a été inaugurée en 2003, pour les BUFR de Lille-III, avec la seule recherche par ISBN. 25 800 exemplaires ont été créés pour 57 304 recherches, soit 47 % de créations d’exemplaire. En 2004, 186 000 exemplaires ont été créés par ce procédé. La clé ISBN permet de créer environ 60 % d’exemplaires sur les demandes reçues, la clé date/auteur/titre 30 %. En 2005, l’équipe chargée de ces opérations a été renforcée, et l’on arrive à plus de 205 300 exemplaires créés mi-novembre, qui correspondent au tiers des importations de l’année. Selon le volume de travail restant à faire après ces créations d’exemplaires, la qualité de la base de la bibliothèque, les possibilités de son équipe et de son fournisseur de SIGB, les notices non localisées automatiquement sont traitées manuellement ou importées dans le Sudoc en format MARC. On arrive ainsi à un traitement à la carte des notices de la bibliothèque.
Au 31.10.2005, le nombre de notices localisées était de 6 142 538.
Stéphane Rey.
Catalogage en ligne : évolution des outils
Mise à disposition de scripts
Chaque année une nouvelle version de WinIBW, l’outil client de catalogage, a permis de corriger les bugs répertoriés, et d’améliorer l’ergonomie de l’outil. WinIBW 3 a beaucoup changé (intérieurement) et permet maintenant à l’utilisateur de créer des scripts ou automatismes prédéfinis pour effectuer des opérations répétitives, ou automatiser une partie du catalogage. L’ABES a fourni aux utilisateurs des scripts complets de catalogage des différents types de documents – monographies, documents audiovisuels, partitions, cartes, thèses, notices d’autorité auteur, etc.
Complétude de la base
La base de production du Sudoc s’enrichit de jour en jour, elle est devenue un réservoir de plus de 7 millions de notices bibliographiques. Ainsi, le travail de catalogage est allégé par le partage des tâches, ainsi que par le versement bimensuel des notices de la Bibliographie de la France et de leurs autorités.
Accès à des bases externes
L’accès direct pendant le catalogage à des bases externes par le protocole Z39.50 donne la possibilité de copier des notices des bases suivantes : RLG (Research Library Group) et LocVoyager (Bibliothèque du Congrès) aux États-Unis, en Europe, Libris (Bibliothèque nationale de Suède) et la Deutsche Bibliothek Database. Pour les publications en série, l’accès à l’ISSN permet de récupérer les notices dès qu’elles sont disponibles, sans attendre les chargements des années précédentes.
Aides en ligne
Le « Guide méthodologique du catalogage dans le Sudoc » accessible en ligne de façon contextuelle offre maintenant une somme d’informations considérable (environ 600 pages). Il regroupe aussi bien des conseils et normes de catalogages, le format de chaque zone et sous-zone, les codes utilisés et leurs libellés, les manuels et supports de formation, bref le vade-mecum du catalogueur, avec mise à jour permanente par l’ABES — à préférer absolument à un tirage papier rapidement obsolète.
Conversions rétrospectives : de la reprise des fiches à la conversion rétrospective en ligne
Longtemps, les conversions rétrospectives ont été faites en masse, d’après les fichiers.
Le tableau ci-dessus indique la répartition par source d’alimentation des notices bibliographiques localisées de la base du Sudoc. Seule une partie des notices chargées – c’est à dire non issues du catalogage courant – est comptabilisée dans cette répartition du fait des fusions (doublons). Les statistiques pour l’année 2005 s’arrêtent au 31 octobre.
Stéphane Rey.
Pour que l’opération soit « rentable », il fallait fournir le plus possible de notices à traiter : on obtenait ainsi de meilleurs prix des fournisseurs. Le Sudoc a donc reçu des fichiers de plusieurs centaines de milliers de notices, venant de différentes bibliothèques, mais livrés en bloc, pour ne pas dire « en vrac ». On se rappelle ainsi la malheureuse livraison de 2002, où le prestataire de conversion rétrospective – depuis disparu du marché – avait « dédoublonné » les notices en attribuant tous les exemplaires à une seule bibliothèque, et en omettant d’ajouter les différents numéros propres à chaque bibliothèque. Ces notices, chargées à tour de bras dans le Sudoc, y ont aggravé la confusion venue de la « reprise des données » initiale : des notices Sibil, OCLC et BN‑Opale et Téléthèses n’ont pas fusionné alors qu’elles auraient dû, d’autres ont fusionné alors qu’elles n’auraient pas dû. En 2002-2003, de gros chargements ont été effectués par OCLC PICA (l’ABES n’avait pas encore la maîtrise du logiciel). 380 000 notices ont été chargées pour la seule BNUS (Bibliothèque nationale et universitaire de Strasbourg), et 600 000 en provenance du marché ministériel, soit près d’un million de notices sur une base qui comptait 5 millions de notices bibliographiques localisées en 2002. En 2004, 200 000 notices de conversion rétrospective ont été importées dans le Sudoc, avec seulement 52 % de nouvelles notices. En 2005, près de 550 000 notices ont déjà été chargées, pour obtenir à peu près 225 000 nouvelles notices, soit 41 %. On voit que plus la base s’enrichit, plus le taux de nouvelles notices baisse : les conversions rétrospectives concernent de plus en plus des notices déjà présentes dans le Sudoc.
Les mêmes notices sont versées et reversées à chaque importation, créant inévitablement de nouveaux doublons, malgré la précision des tables d’importation et de dédoublonnage et toutes les améliorations apportées par l’ABES pour affiner les programmes de chargements.
L’équipe « Données » de l’ABES a milité sans relâche pour obtenir que les conversions rétrospectives se fassent désormais en ligne, ce qui est chose acquise depuis cette année. Les avantages de cette nouvelle solution sont multiples pour tous les acteurs :
- les bibliothèques voient le résultat et récupèrent les notices dans leur système local jour après jour, au lieu d’attendre des mois voire des années ;
- les anomalies peuvent être traitées immédiatement ;
- le Sudoc est enrichi en ligne par les nouvelles notices ou de nouveaux exemplaires ;
- l’équipe « Données » de l’ABES n’a plus à effectuer des chargements gourmands en temps de travail humain et machine pour un résultat moyen.
Pour nous aider dans cette démarche, la BNF a bien voulu nous mettre à disposition un fichier correspondant à la « rétroconversion » dite CGI (Catalogue général des imprimés), soit 3 millions de notices chargées dans la base d’appui.
Ces notices peu conformes au catalogage ISBD courant ont été reformatées par l’ABES pour devenir plus facilement utilisables.
L’ABES et les conversions rétrospectives dans les bibliothèques
Depuis quelques années, avec une accélération particulière ces derniers temps, les bibliothèques souhaitent intégrer les notices de leurs anciennes fiches papier dans leurs catalogues en ligne. Petit à petit, les mètres linéaires des fichiers d’autrefois vont disparaître, engloutis sans retour dans le Sudoc puis dans les « Systèmes de gestion de bibliothèques », pour le plus grand bien de tous, lecteurs et bibliothécaires.
Des opérations sont programmées de toutes parts, selon plusieurs procédures : marchés ministériels par lots de 10 000 fiches, marchés lancés par les bibliothèques pour des lots moins importants, ou des opérations de catalogage livre en main de fonds de documents anciens, ou de fonds en écritures non-latines, et enfin s’y ajoute le catalogage rétrospectif au fil de l’eau par le personnel de la bibliothèque.
L’ABES aide les bibliothèques à rédiger le cahier des charges ou les spécifications particulières dans le cadre des marchés. Elle aide aussi à contrôler et vérifier la qualité du catalogage dans le Sudoc. Les prestataires choisis bénéficient d’une formation à l’ABES. Celle-ci met à la disposition des bibliothèques des licences gratuites qui sont utilisées par les prestataires.