Rameau et Skos

DOI : 10.35562/arabesques.2109

p. 13-14

Outline

Text

Une expérimentation

Le langage RAMEAU, dans le cadre du projet européen TELplus et en collaboration avec la Bibliothèque nationale de France et le Centre national RAMEAU, a fait l’objet, à titre expérimental, d’une première conversion au format web sémantique RDF (Ressource Description Framework), suivant le modèle de représentation SKOS (Simple Knowledge Organization System). Nous présentons dans cet article quelques détails du travail réalisé, ainsi que les perspectives que celui-ci ouvre quant aux usages futurs du langage.

Une brève introduction au web sémantique

La notion de web sémantique [Berners-Lee] – ou plus récemment, celle de web de données – fait référence à un ensemble de technologies promues par le consortium W3C, permettant de représenter, d’échanger et d’exploiter des informations structurées sur le World Wide Web. Les pages web actuelles permettent aisément à un utilisateur humain d’accéder à l’information qu’elles contiennent, et de naviguer vers d’autres sites contenant des informations liées. Cependant, il est beaucoup plus difficile pour des machines – services web, moteurs de recherche – d’exploiter l’information publiée sur le web de façon fine, « intelligente », sans avoir à la réinterpréter via des outils d’analyse linguistique et/ou statistique.

L’objectif du web sémantique est de pallier les déficiences du web actuel en lui ajoutant un niveau supplémentaire, entièrement dévolu à la publication de (méta‑)données aisément exploitables par des machines. Concrètement, l’approche du web sémantique est relativement simple mais ambitieuse : publier sur le web, selon un formalisme standard appelé RDF, des connaissances en tant que descriptions de ressources web. Pour ceci, tout élément dont on veut donner une description, comme une personne, un livre ou un sujet, se voit attribuer un identifiant web, une URI : par exemple, rameau :manchot. Les URIs sont ensuite liées entre elles par des assertions ternaires, des triplets, formalisant le lien qui existe entre elles. Par exemple, (rameau :manchots, a-pour terme-générique, rameau :oiseaux). De proche en proche, ces assertions simples permettent de constituer un réseau de connaissances complexes. Ce réseau, tout comme celui des sites web « classiques », est accessible via le protocole internet HTTP, soit par le biais des entrepôts interrogeables en utilisant le langage de requêtes SPARQL, soit par celui de serveurs web qui renvoient directement les informations dont ils disposent sur des ressources web de leur domaine – comme un serveur web standard renvoie une page HTML lorsqu’un navigateur l’interroge avec une adresse donnée.

SKOS

RDF ne suffit pas à lui tout seul à représenter des informations réellement partageables et exploitables : tout comme pour XML, il faut lui adjoindre des schémas – on parle d’ontologies – qui définissent les briques de base des descriptions, comme le lien a-pour-terme-générique de notre exemple. SKOS fournit une ontologie dédiée aux vocabulaires contrôlés et structurés (knowledge organization systems) tels que les thésaurus, classifications, taxonomies, etc. [SKOS] Il repose sur un modèle qui se veut à la fois simple et compatible avec une majorité d’approches existantes. À ce titre, il est inspiré par des formats ou des guides comme la norme ISO 2788 :1986 pour les thésaurus, mais son objectif n’est pas de remplacer ceux‑ci dans leur contexte d’utilisation initial. Il s’agit de faciliter la publication, l’échange et l’interconnexion de ces vocabulaires dans le contexte nouveau du web sémantique.

Mise en correspondance d’Intermarc et SKOS

Les informations lexicales et conceptuelles de RAMEAU sont représentées dans des notices au format Intermarc [Intermarc].

Une fois les entités à décrire de RAMEAU munies d’URIs, produire une description en SKOS de celles-ci implique donc de mettre en correspondance (mapping) le modèle d’Intermarc et celui de SKOS, puis de mettre en œuvre un programme de conversion qui réalise cette correspondance. Nous signalons ici les aspects les plus importants de cette mise en correspondance :

  • chaque notice (regroupant une vedette matière et les formes rejetées) donne naissance à une ressource de type skos:Concept ;
  • les données terminologiques (zones 166 et 466 du format Intermarc) sont représentées au moyen des propriétés skos: prefLabel et skos:altLabel ;
  • les liens sémantiques (zones 302 et 301) sont représentés par les propriétés skos:related et skos:broader, qui pointent vers les concepts correspondants à d’autres notices ;
  • les notes, comme la zone 300, sont représentées au moyen de propriétés de documentation dédiées, comme skos: scopeNote.

Il est à noter que la conversion n’est pas complète, en particulier concernant les constructions syntaxiques de RAMEAU. SKOS en tant que tel ne permet pas de représenter les notions liées à la coordination de vedettes : tête de vedettes, subdivisions, vedettes construites… Si des usages web sémantique non encore pressentis au moment de la création de SKOS et de cette expérience de conversion requièrent d’échanger de telles informations, il faudra alors réutiliser (ou créer) une extension appropriée. Il faut aussi remarquer que notre expérimentation ne propose pas de forme définitive pour les identifiants web des ressources RAMEAU. Il appartiendra aux instances représentatives du réseau national RAMEAU de décider d’une convention de « nommage » des concepts du langage.

Deux concepts de Rameau représentés sous forme de graphe RDF/SKOS

Image

Perspectives

Le travail présenté ici est une étape importante pour mieux exploiter et partager les données de RAMEAU dans le cadre du web sémantique. Ceci peut se révéler très intéressant pour les bibliothèques utilisant RAMEAU et pour lesquelles les problèmes d’interopérabilité et d’ouverture des données deviennent de plus en plus importants. Une telle conversion permet en effet de relier plus facilement et plus explicitement RAMEAU aux objets de son contexte institutionnel et conceptuel. Par exemple, lorsque la Library of Congress aura publié le vocabulaire LCSH en SKOS sur son propre domaine [LCSH], officialisant les expérimentations précédentes [Summers], il sera possible de représenter d’une manière explicite, immédiatement exploitable, les liens entre RAMEAU et LCSH. De façon plus générale, nous espérons qu’une large mise à disposition (sous réserve d’acceptation par les instances représentatives du réseau national) de RAMEAU en SKOS, à savoir selon un format ouvert et compatible avec le web, permettra le développement d’applications innovatrices, dans la communauté RAMEAU actuelle et au-delà.

Bibliography

Références internet

[TELplus]
http://www.theeuropeanlibrary.org/portal/organisation/cooperation/telplus/

[SKOS]
http://www.w3.org/2004/02/skos/

[RAMEAU]
http://rameau.bnf.fr/

[Intermarc]
http://www.bnf.fr/pages/infopro/produits/pb-aidprod_inter.htm

[LCSH]
http://id.loc.gov/

Articles

[Berners-Lee]
Tim Berners-Lee, James Hendler, Ora Lassila, The Semantic Web, Scientific American, 284(5):34-43, 2001. Traduction française
http://www.urfist.cict.fr/archive/lettres/lettre28/lettre28-22.html

[Summers]
Ed Summers - Antoine Isaac, Clay Redding, Dan Krech LCSH, SKOS and Linked Data - Proceedings of the International Conference on Dublin Core and Metadata Applications, (DC 2008)
http://arxiv.org/abs/0805.2855

Illustrations

Deux concepts de Rameau représentés sous forme de graphe RDF/SKOS

Deux concepts de Rameau représentés sous forme de graphe RDF/SKOS

References

Bibliographical reference

Antoine Isaac and Thierry Bouchet, « Rameau et Skos », Arabesques, 54 | 2009, 13-14.

Electronic reference

Antoine Isaac and Thierry Bouchet, « Rameau et Skos », Arabesques [Online], 54 | 2009, Online since 20 août 2020, connection on 30 novembre 2021. URL : https://publications-prairial.fr/arabesques/index.php?id=2109

Authors

Antoine Isaac

Vrije Universiteit Amsterdam - De Boelelaan 1081a, 1081HV AMSTERDAM - http://www.few.vu.nl/

aisaac@few.vu.nl

Author resources in other databases

Thierry Bouchet

Bibliothèque nationale de France - www.bnf.fr

thierry.bouchet@bnf.fr

Author resources in other databases

Copyright

CC BY-ND 2.0