L’intelligence artificielle à la Bibliothèque nationale de Norvège

DOI : 10.35562/arabesques.603

p. 20

Plan

Texte

La Bibliothèque nationale de Norvège met en œuvre des techniques d’intelligence artificielle sur différents corpus de documents.

Puisque les bibliothèques sont gestionnaires d’informations et de connaissances, spécialistes des contenus et des métadonnées, il semble logique que l’intelligence artificielle (IA) puisse être utilisée par les professionnels. Conservant d’importantes collections numériques, avec des métadonnées de grande qualité, les bibliothèques sont des plateformes idéales d’entraînement pour les systèmes d’apprentissage d’IA. A priori, un grand nombre de tâches réalisées en bibliothèque pourraient être assistées, voire assurées, par des systèmes à base d’IA.

L’intelligence artificielle en bibliothèque ?

Depuis de nombreuses années, la Bibliothèque nationale de Norvège numérise et gère également le dépôt légal numérique. Il en résulte une collection numérique importante, et une connaissance fine des utilisateurs. Dotée d’une équipe conséquente et expérimentée, d’une infrastructure informatique éprouvée, la Bibliothèque nationale de Norvège avait besoin de workflows plus efficaces, en vue d’une connaissance approfondie des collections et de l’amélioration des services aux utilisateurs.

Dans ces circonstances, un laboratoire d’expérimentation de l’IA a été mis en place, dans l’optique de répondre aux besoins internes mais également de stimuler, au plan international, les recherches sur l’IA en bibliothèques. Ce laboratoire a pour but d’explorer les potentialités d’utilisation de l’IA dans les bibliothèques, mais aussi dans les archives et dans les musées.

Avec un effectif de 3 à 4 personnes à temps plein, le rôle principal de l’IA-Lab est de concevoir des démonstrations expérimentales et des preuves de concept, plutôt que de générer des outils de production proprement dits. En fonction des résultats, cela donne lieu à la modification éventuelle d’applications existantes, ou à la mise en œuvre de nouvelles applications. Le laboratoire dépend directement de la direction de la bibliothèque, ce qui illustre le fait que ses activités concernent potentiellement tous les secteurs.

Quelques exemples d’utilisation

Classification de la littérature

Appliquée au domaine de la littérature sur des collections numérisées – et leurs métadonnées –, l’IA aide à déterminer comment les bibliothécaires appliquent les classifications par genre. Une partie des données est utilisée pour le travail d’apprentissage, le reste pour évaluer la qualité de ce travail. Après un apprentissage rapide, l’outil est déjà capable d’établir une classification par genre correcte dans 95 % des cas. Dans un domaine proche, une autre étude a consisté à tester l’apprentissage d’utilisation de la classification décimale Dewey sur des articles scientifiques nativement numériques, avec des indices de 3 à 6 chiffres : le système crée un indice correct dans 92 à 96 % des cas.

Analyser les images

Par ailleurs, les principes de l’IA ont été appliqués à plus de 150 000 documents photographiques à caractère historique, pour identifier des photographies visuellement proches, de façon à permettre une meilleure navigation dans les collections d’images. En complément, la description automatisée d’une photographie spécifique a été testée. Dans les deux cas, l’expérience a été concluante.

Approche holistique

Pour tester l’utilisation des techniques d’IA de manière plus générale, un projet encore plus ambitieux a été mis en œuvre. Dans cette expérience, le laboratoire a tenté de concevoir un service qui génère les métadonnées d’une bibliothèque numérique sans recours à des humains. Pour tester le système, on a utilisé un ensemble de données produites, sur un mois de l’année 2001, par 220 journaux, 2 chaînes de radio et une chaîne de télévision. En se basant sur des systèmes d’apprentissage élaborés en interne et des systèmes commerciaux, le nouvel outil a été capable d’extraire des noms de personnes, d’organisations, de lieux, et d’établir des relations entre eux, pour les trois types de médias concernés. Toutes ces informations ont ensuite été reliées à un système de géolocalisation, et présentées aux utilisateurs soit sous forme de cartes, soit par un outil de recherche spécifique. Même s’il reste encore à faire pour ajuster l’efficacité de l’outil en termes de qualité et de précision, cette expérimentation pilote montre que des systèmes à base d’IA peuvent offrir un service comparable à ceux dans lesquels les métadonnées sont élaborées par des humains.

Citer cet article

Référence papier

Svein Arne Brygfjeld, « L’intelligence artificielle à la Bibliothèque nationale de Norvège », Arabesques, 94 | 2019, 20.

Référence électronique

Svein Arne Brygfjeld, « L’intelligence artificielle à la Bibliothèque nationale de Norvège », Arabesques [En ligne], 94 | 2019, mis en ligne le 15 novembre 2019, consulté le 19 avril 2024. URL : https://publications-prairial.fr/arabesques/index.php?id=603

Auteur

Svein Arne Brygfjeld

Responsable du IA-Lab - Bibliothèque nationale de Norvège

svein.arne.brygfjeld@nb.no

Autres ressources du même auteur

Droits d'auteur

CC BY-ND 2.0