La création en 2010 de l’appli IdRef a ouvert un vaste travail collaboratif sur les référentiels qui, dans un contexte de mutualisation et d’interopérabilité, doivent plus que jamais être fiables et de qualité.
La création du Sudoc a mis en évidence la nécessité d’un travail de normalisation pour construire un socle de référentiels de qualité des autorités personnes physiques et des collectivités auteurs. En 2010, l’Abes, par extraction des référentiels d’autorité du Sudoc, crée IdRef, une application Web qui peut désormais interroger les plus de 3,5 millions d’entités des référentiels Sudoc, rapatrier l’identifiant d’une entité (personne, concept, collectivité) ou encore créer une nouvelle entité. Les données d’autorité du Sudoc se sont ouvertes et sont disponibles pour l’ensemble des professionnels de l’Information scientifique et technique. Dans ce contexte de mutualisation et d’interopérabilité, les métadonnées doivent plus que jamais être fiables et de qualité.
Des outils pour faciliter les chantiers qualité
Les services Algodoublons (repérage des notices d’autorité doublons) et Algoliens (repérage des liens manquants entre notices bibliographiques et notices d’autorité) sont développés par l’Abes et mis à disposition du réseau. La formation des professionnels est assurée à distance dans le cadre des « J.e-cours ». Paprika, application professionnelle de curation des données, est conçue comme outil complémentaire d’aide à la décision en cas de lien manquant ou erroné entre notice d’autorité et notice bibliographique.
Au SCD de l’Université de Caen Normandie, plusieurs chantiers qualité des données ont été réalisés de 2017 à 2020. Ils ont permis, avec la participation d’une vingtaine de catalogueurs, la résolution de 3500 liens entre notices bibliographiques et notices d’autorité personnes physiques, et la création de 2500 notices d’autorités. Le prochain chantier s’inscrira directement dans le cadre des services aux chercheurs de l’établissement en ciblant la qualité des données d’autorité les concernant. Il s’agira d’attribuer à chaque membre de la communauté de l’ESR un identifiant pérenne et de travailler sur le contenu descriptif des notices d’autorité pour lever les ambiguïtés et éviter la création de doublons.
Des traitements algorithmiques initiés par l’Abes permettent l’alignement automatique des identifiants IdRef et des identifiants HAL. Cet alignement rend désormais visibles les références HAL dans IdRef. En 2015, la signature du protocole d’entente entre ORCID1 et l’Abes avalise l’utilisation des identifiants ORCID dans les notices d’autorité et, réciproquement, celle des données IdRef dans les comptes ORCID. En 2019, l’Abes devient co-pilote avec le consortium Couperin de la communauté ORCID France qui comprend aujourd’hui 36 membres. L’adoption de l’identifiant ORCID par les chercheurs pour favoriser leur visibilité internationale est encouragée.
Augmenter la visibilité des structures de la recherche
La naissance de Theses.fr en 2011 et le développement de l’Open Access ont mis l’accent sur la nécessaire visibilité des structures de recherche des institutions de l’ESR. Ecoles doctorales, laboratoires de recherche, établissements tutelles, les données d’autorités de ces structures doivent aussi être normalisées, enrichies et désambiguïsées.
Dès le lancement du portail HAL Normandie en novembre 2017, un travail de vérification, complétude et validation des notices du référentiel AuréHAL a été mené par la cellule d’appui du portail. Pour le prolonger et renforcer la visibilité de ces données, un chantier s’est engagé au SCD de Caen et suit son cours, en lien avec l’Abes et l’administrateur du portail HAL Normandie. Il porte sur l’alignement des identifiants externes (Répertoire national des structures de recherche, AuréHAL), l’exactitude des points d’accès et le renseignement des variantes de forme des structures de recherche dans IdRef.
Le chantier de la qualité des référentiels est un travail collaboratif. L’échange entre les différents intervenants (coordinateur Sudoc, chef de projet Open Access et développement de l'IST, administrateur du portail HAL) est primordial pour collecter et fiabiliser les données d’autorité des enseignants-chercheurs et des structures d’un établissement de l’ESR.