<?xml version="1.0" encoding="UTF-8"?>
<TEI
change="metopes_publication#openedition"
xmlns="http://www.tei-c.org/ns/1.0"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xmlns:xs="http://www.w3.org/2001/XMLSchema"
xmlns:xlink="http://www.w3.org/1999/xlink"
xmlns:xi="http://www.w3.org/2001/XInclude"
xmlns:ns="http://www.tei-c.org/ns/1.0"
xmlns:mathml="http://www.w3.org/1998/Math/MathML"
xmlns:loext="urn:org:documentfoundation:names:experimental:office:xmlns:loext:1.0"
xmlns:dcr="http://www.isocat.org/ns/dcr"
><teiHeader
><fileDesc
><titleStmt
><title
type="main"
>data.idref.fr : un référentiel d’autorités dans le web sémantique pour l’ESR et au-delà</title
><author
role="aut"
><name
>Michaël Jeulin</name
><affiliation
><ref
target="#aff01"
type="affiliation"
></ref
></affiliation
><idno
type="IDREF"
>240228618</idno
><idno
type="VIAF"
>http://viaf.org/viaf/108157340583609920922</idno
></author
></titleStmt
><editionStmt
><edition
><date
>2024-01-03T20:26:00</date
></edition
></editionStmt
><publicationStmt
><publisher
></publisher
><ab
type="papier"
><dimensions
><dim
type="pagination"
>30</dim
></dimensions
><date
>01/01/2024</date
></ab
><idno
type="book"
></idno
><ab
type="lodel"
><date
></date
></ab
></publicationStmt
><sourceDesc
><p
>Version Métopes : 3.0</p
><p
>Written by OpenOffice</p
><bibl
>Arabesques</bibl
></sourceDesc
></fileDesc
><encodingDesc
><tagsDecl
><rendition
scheme="css"
xml:id="none"
>color:black;</rendition
></tagsDecl
></encodingDesc
><profileDesc
><langUsage
><language
ident="fr-FR"
></language
></langUsage
><textClass
><keywords
scheme="keyword"
xml:lang="fr"
><list
><item
>Système D : des outils pour vos données</item
></list
></keywords
></textClass
></profileDesc
><revisionDesc
><change
when="2024-01-12T10:21:00"
who="abes"
>Révision</change
></revisionDesc
></teiHeader
><text
xml:id="text"
><front
><titlePage
><docTitle
><titlePart
style="T_3_Article"
type="main"
>data.idref.fr : un référentiel d’autorités dans le web sémantique pour l’ESR et au-delà</titlePart
></docTitle
><docAuthor
style="txt_auteur"
>Michaël Jeulin</docAuthor
><byline
style="auteur_Courriel"
><email
><ref
target="mailto:jeulin@abes.fr"
>jeulin@abes.fr </ref
></email
></byline
><byline
style="auteur_Institution"
><affiliation
xml:id="aff01"
>Gestionnaire de métadonnées, Service Outils et Méthodes de l’Abes</affiliation
></byline
></titlePage
><div
type="resume_motscles"
><p
style="txt_Motclef"
> : Système D : des outils pour vos données</p
></div
><argument
><p
style="txt_chapo"
>Lancé en 2018, le triplestore data.idref.fr a progressivement étendu son périmètre au-delà des seules données de l’Abes et compte aujourd’hui plus de 6 millions de données.</p
></argument
></front
><body
><div
type="chapitre"
xml:id="mainDiv"
><p
style="txt_Normal"
>Approfondissant la stratégie d’exposition des données sur le web sémantique, le triplestore data.idref.fr a été lancé en 2018, permettant d’interroger en SPARQL et en RDF les données d’IdRef, alimentées par les réseaux d’utilisateurs des applications de l’Abes. Dès le départ data.idref.fr a été conçu comme un miroir de la base IdRef elle-même, et non pas comme un dump mis à jour périodiquement comme c’est fréquemment le cas : chaque modification d’IdRef y est répercutée en temps réel. Cinq ans plus tard, il est temps de faire un bilan du chemin parcouru par ce service.</p
><div
type="section1"
><head
style="T_1"
subtype="level1"
>Une base d’entités en plein essor…</head
><p
style="txt_Normal"
>Un nombre donne une première idée de l’évolution de la base : alors qu’à son ouverture elle contenait 110 millions de « triplets », c’est-à-dire de données, elle en compte désormais, fin 2023, près de 275 millions. Dans le détail, les entités sont passées de 3,5 millions à plus de 6 millions en 2023, dont près de 4 millions pour les seules personnes. Cette progression reflète pour partie les créations d’autorités dans IdRef. Mais elle est aussi le résultat d’enrichissements successifs de la modélisation. Par petites touches, toujours plus d’informations de l’Unimarc natif d’IdRef ont été extraites : libellés, genre pour les personnes, notes, identifiants externes, relations entre entités (pour les organisations notamment)<note
n="1"
place="foot"
style="txt_Note"
type="standard"
xml:id="ftn1"
><p
> Documentation du modèle de données : <ref
target="https://documentation.abes.fr/aideidrefdata"
><hi
rend="underline"
style="typo_souligne"
>https://documentation.abes.fr/aideidrefdata</hi
></ref
></p
></note
>.</p
></div
><div
type="section1"
><head
style="T_1"
subtype="level1"
>… qui est aussi une base bibliographique</head
><p
style="txt_Normal"
>D’autre part, data.idref n’est pas seulement un pur référentiel d’autorités mais aussi un réservoir de références bibliographiques. À l’origine, on n’y trouvait que celles issues du Sudoc, ainsi que les thèses. Leur description, tout en restant succincte, a également été enrichie pour faciliter les recherches : précision des types de documents, dates de publication,nombre de localisations dans le Sudoc (holdings). IdRef étant devenu au fil du temps le pivot des applications de l’Abes, data.idref.fr se devait de refléter cette centralité. Cela a été fait en intégrant les références issues d’autres applications de l’Abes : Calames, le catalogue des archives et manuscrits de l’enseignement supérieur, et SciencePlus, autre triplestore hébergeant une sélection des références d’articles et chapitres de documentation électronique provenant d’éditeurs ou diffuseurs, et où les auteurs sont identifiés à chaque fois que possible à des entités IdRef.</p
></div
><div
type="section1"
><head
style="T_1"
subtype="level1"
>data.idref.fr dans IdRef !</head
><p
style="txt_Normal"
>Plusieurs informations proposées dans IdRef illustrent le type de service que peut apporter un triplestore : pour chaque auteur les listes de ses coauteurs, des collectivités associées et de ses champs disciplinaires, ou pour une organisation les autres collectivités liées, sont fournies par des requêtes SPARQL envoyées de manière dynamique à data.idref.fr, utilisées donc comme des webservices.</p
></div
><div
type="section1"
><head
style="T_1"
subtype="level1"
>Une intégration dans un écosystème plus large</head
><p
style="txt_Normal"
>Parallèlement, IdRef et data.idref ont progressivement étendu leur périmètre au-delà des seules données de l’Abes, par des alignements (réalisés par l’Abes ou produits par les professionnels) avec des gisements documentaires extérieurs : BnF, HAL, Cairn, OpenEdition, Erudit… Ces alignements permettent d’intégrer dans le triplestore les références bibliographiques à partir de toutes ces sources, réunies autour des identifiants IdRef, et donc de les interroger en une seule requête, pour les réutiliser<note
n="2"
place="foot"
style="txt_Note"
type="standard"
xml:id="ftn4"
><p
> Voir l’article consacré à <ref
target="https://publications-prairial.fr/arabesques/index.php?id=3825"
><hi
rend="underline"
style="typo_souligne"
>SoviSu+</hi
></ref
></p
></note
>.</p
><p
style="txt_Normal"
>Les documents signalés dans data.idref sont ainsi passés de 11 à 16,2 millions depuis 2018, et sont liés aux entités IdRef par 57 millions de liens distincts, dont plus de 28 millions de relations de contributions. Au-delà de ces sources documentaires, d’autres alignements d’entités intègrent toujours davantage data.idref.fr dans un écosystème plus vaste : ISNI, VIAF, Wikidata, ORCID, ROR, permettant de rebondir vers d’autres environnements, notamment via le web sémantique<note
n="3"
place="foot"
style="txt_Note"
type="standard"
xml:id="ftn5"
><p
> Une sélection de triplestores « amis » est proposée en page d’accueil de data.idref.fr, et parmi les exemples de requêtes proposés : <ref
target="https://data.idref.fr/yasgui.html"
><hi
rend="underline"
style="typo_souligne"
>https://data.idref.fr/yasgui.html</hi
></ref
>, des requêtes « fédérées » avec data.bnf.fr, data.persee.bnf.fr, <ref
target="https://query.wikidata.org/"
><hi
rend="underline"
style="typo_souligne"
>https://query.wikidata.org</hi
></ref
> </p
></note
>.</p
></div
></div
></body
></text
></TEI
>
