Le Secteur Archives de la recherche - Phonothèque de la Médiathèque SHS de la Maison méditerranéenne des sciences de l’homme s’appuie sur les principes FAIR pour des données faciles à trouver, accessibles, interopérables et réutilisables.
Le Secteur Archives de la recherche – Phonothèque de la Médiathèque SHS de la Maison méditerranéenne des sciences de l’homme (MMSH)1 réunit, conserve et met à disposition de tous les publics 600 mètres linéaires d’archives, plus de 100 000 photographies et 8 000 heures d’enregistrements sonores et audiovisuels issus de la recherche en sciences humaines et sociales. Carnets de terrain, manuscrits, dessins, documentation papier, plaques de verre, diapositives, tirages, films, cassettes, bandes, données du web ou fichiers numériques natifs : autant de documents qui témoignent du travail des chercheur·se·s et rendent compte de leurs terrains. Pour les archiver, l’équipe du secteur Archives de la recherche s’appuie sur les outils proposés par les infrastructures académiques nationales : l’Abes (Agence bibliographique de l’enseignement supérieur et de la recherche), l’IR* Huma-Num, le CCSD (Centre pour la communication scientifique directe), le Cines (Centre informatique national de l’enseignement supérieur) et OpenEdition Center. Comment interagissent entre eux et se complètent ces outils ? Pour notre méthode d’archivage, nous avons choisi de suivre les 4 lettres des principes FAIR sur lesquels nous nous appuyons pour le traitement et l’organisation de nos données et métadonnées : faciles à trouver, accessibles, interopérables et réutilisables.
Fonds Jean-Pierre Olivier de Sardan - Notes manuscrites sur des questions de méthodologie, sur des exposés de pairs, projet de livre, extrait de cours, chemise n° 7 [cote : MMSH_ODS_ B3_C-19_001-075_018], page 18, 1990.
Faciles à trouver
La plateforme Calames de l’Abes est au cœur de nos outils2. Nous décrivons nos instruments de recherche dans le standard international des archives, l’Encoded Archival Description (EAD), et Calames fournit un identifiant stable. Lorsque les questions juridiques et éthiques pour la diffusion des données sont réglées, nous utilisons des plateformes spécifiques pour les disséminer. Dès 2011, nous avons placé nos photographies sur la plateforme mediHAL3 développée par le CCSD, tandis qu’à partir de 2015 les carnets de terrain, les archives papier numérisées, les fichiers texte ou tableurs nativement numériques ont été déposés sur Nakala4 géré par l’IR Huma-Num. Sur ces deux plateformes, les données reçoivent un identifiant unique (soit un numéro HAL, soit un DOI5) que nous précisons dans les métadonnées et les dispositifs de mediHAL ou de Nakala permettent d’indexer les données et de les retrouver.
Accessibles
Dès 2007, alors que la numérisation des archives s’amplifiait, nécessitant des espaces de stockage toujours plus importants, nous avons d’abord bénéficié des tous premiers services du TGE Adonis6, devenu TGIR Huma-Num7 puis en 2022 l’IR Huma-Num. Dès 2011, le secteur archives de la recherche de la MMSH a également été impliqué dans le consortium « Archives des ethnologues »8 à travers lequel nous avons pu échanger sur nos pratiques archivistiques dans les laboratoires de recherche, nous former et comprendre comment faciliter l’accessibilité à nos données dans un monde numérique aux infrastructures en train de se construire. Aujourd’hui, nos données sont préservées à la fois sur des serveurs sur site supervisés par le service informatique de la MMSH, et sur l’espace sécurisé distant nommé « Huma-Num Box » géré par l’IR* en miroir (Paris et Villeurbanne). Enfin, engagées dans la problématique de l’accessibilité même lorsque les données ne peuvent pas être ouvertes à toutes et tous, nous travaillons à leur partage en nous appuyant sur des conventions de collaborations scientifiques. Nos métadonnées sont accessibles à travers Calames, l’accès ou l’absence d’accès aux données sont toujours documentés et nous partageons les fichiers avec celles et ceux qui bénéficient de droits spécifiques. Ainsi cette année, une convention avec le LASDEL (Laboratoire de recherche en sciences sociales)9 à Niamey, a été signée afin de préciser les modalités de partage des données de l’anthropologue Jean-Pierre Olivier de Sardan10 avec des chercheurs du terrain nigérien ayant participé à ces enquêtes. Un export au format CSV11 de nos métadonnées à partir de Calames est partagé avec le laboratoire et l’accès distant protégé se fait à travers un espace Sharedocs, géré par l’IR* Huma-Num. Un autre exemple de facilitation de l’accessibilité est de proposer l’enrichissement des données numérisées en mode image vers le mode texte. Ainsi une partie des carnets de terrains d’anthropologues de la MMSH (Marceau Gast, Annie-Hélène Dufour) sont accessibles sur la plateforme Trancrire12 où les internautes fournissent une transcription textuelle collaborative.
Interopérables
L’interopérabilité des métadonnées est assurée par le format EAD de Calames et l’indexation par la plateforme IdRef. Les données elles-mêmes, placées dans Nakala et mediHAL sont documentées au format Dublin Core qualifié (Nakala) ou XMP EXtensible Metadata Platform (mediHAL) et rattachées dans la zone <dao> de l’EAD de Calames par leur identifiant (DOI ou n° HAL). Métadonnées et données sont moissonnées par différents moteurs de recherche thématiques nationaux comme celui de FranceArchives13, d’Isidore14, une partie des photographies est moissonnée par Navigae15 et les archives sonores le sont sur le Portail du patrimoine oral16 et le serveur européen Clarin17. Pour accroître leur visibilité dans les catalogues communs, nous les référençons dans un second temps sur le Catalogue collectif de France18.
Réutilisables
Au service de tous les publics, le réusage des archives est le défi qui nous anime avant tout. Puisque dès que c’est possible, nos données sont placées sous un régime de licences libres, nous ne sommes pas toujours informées des réutilisations. Aussi c’est toujours un grand plaisir pour nous d’apprendre la création d’une installation, d’un podcast, d’une pièce de théâtre ou d’une publication qui s’appuie sur les métadonnées et les données diffusées dans nos instruments de recherche. Dans la dynamique de la devise des principes FAIR « Aussi ouvert que possible, aussi fermé que nécessaire », notre vigilance est extrême sur les droits de réusage associés aux données. Ainsi, nous précisons tous les éléments nécessaires aux futur·e·s utilisateur·rice·s des données en indiquant systématiquement des licences explicites et accessibles. La résolution de ces questions est en réflexion constante, abordée de façon collective dans un carnet de recherche spécifique : Questions juridiques et éthiques pour la diffusion des données en SHS19. Un autre carnet sur la plateforme d’OpenEdition20, propre à notre travail quotidien, partage ces expériences de réusage et plus largement décrit nos fonds, informe sur nos séminaires, nos formations et notre méthodologie.
Signalons, pour conclure, que pour chacun des fonds, lorsque les données et l’instrument de recherche sont prêts pour un dépôt sur le long terme sur les serveurs du Cines, nous rédigeons un plan de gestion de données rétrospectif21. Ce dernier, outre les informations d’usage, décrit les pratiques, les outils, les acteurs et leur évolution tout au long du processus de traitement : notre objectif est que l’utilisateur·trice de demain puisse relire, revoir, réentendre ces archives avec tous les éléments de contexte pour les appréhender dans la durée.