Huma-Num propose des services dédiés à la production, la gestion et la réutilisation de données numériques et favorise l’émergence d’outils et de bonnes pratiques issus des communautés scientifiques des SHS.
Les projets de recherche en sciences humaines et sociales (SHS) produisent d’importants volumes de données numériques et utilisent des outils spécialisés pour les rendre accessibles, les traiter et les diffuser. Cela nécessite la mise en œuvre de moyens technologiques qui se doivent d’être stables, bien dimensionnés et en adéquation avec l’évolution des pratiques scientifiques. Pour accompagner la maîtrise par les projets de cet environnement complexe, il est nécessaire de lui associer des compétences diversifiées et en constante évolution. C’est la mission d’Huma-Num1, infrastructure de recherche (IR)2 ayant pour tutelles principales le CNRS et le Campus Condorcet, et pour tutelle secondaire l’université d’Aix-Marseille. Huma-Num propose des services dédiés à la production, la gestion et la réutilisation de données numériques et favorise ainsi l’émergence d’outils et de bonnes pratiques issus des communautés scientifiques SHS. Huma-Num est également impliquée dans la construction d’infrastructures européennes.
Fournir des moyens et outils adaptés aux besoins des projets
Huma-Num développe une grille de services qui répond aux principaux besoins de stockage, de traitement et d’exposition des données de la recherche en SHS. Celle-ci se caractérise par la production et l’utilisation de données ayant des typologies et des provenances très diverses selon la nature des projets. Par ailleurs, les formats, la volumétrie, les besoins de traitements, les possibilités de diffusion varient fortement d’un projet à l’autre. Dans ce contexte, Huma-Num maintient un ensemble de services informatiques mutualisés et sécurisés qui doivent pour autant répondre à des besoins hétérogènes. Pour se rapprocher au mieux des besoins de chaque chercheuse et chercheur, Huma-Num appuie son offre de services et d’outils sur l’expertise forgée par des communautés scientifiques réunies en consortiums. Ces consortiums Huma-Num sont constitués de chercheurs, d’informaticiens et de spécialistes de l’information et de la documentation qui disposent alors d’un cadre pour travailler collectivement sur des objets scientifiques issus d’une même discipline, par exemple des cartes de géographes, ou transverse à plusieurs disciplines, comme les modèles 3D. C‘est en s’appuyant sur ses consortiums et sur le HNLab, pôle d’innovation qui développe des projets autour de nouveaux services en accueillant des chercheuses et des chercheurs en résidence, qu’Huma-Num structure ses services numériques autour du cycle de vie des données. Chaque étape de ce cycle peut être pris en charge par les services mis à disposition, que ce soit pour du stockage sécurisé et des outils pour le traitement des données sur la grille de calcul ; pour entreposer des données, les stocker et les exposer avec le service Nakala ; pour préserver des données sur le long terme sur la plateforme du Cines3. Huma-Num développe et maintient également le moteur de recherche et d’accès unifié Isidore4. Dans la conception de ses services, Huma-Num porte une attention particulière aux enjeux actuels de la science ouverte et des aspects juridiques et éthiques des données de la recherche, tout en recherchant des solutions pratiques et fiables pour les utilisateurs.
Accompagner les utilisateurs
Initialement intégré aux activités de chaque ingénieur, l’accompagnement des utilisateurs a été structuré en 2020 au sein d’un pôle interne dédié. Celui-ci s’appuie sur un réseau de correspondants relais au sein des Maisons des Sciences de l’Homme présentes sur l’ensemble du territoire national. En effet, l’accompagnement des utilisateurs est identifié comme un levier nécessaire et prioritaire pour améliorer la gestion des données et ainsi répondre pleinement aux enjeux du FAIR (Findable, Accessible, Interoperable, Reusable). Si les services numériques sont variés, les besoins en termes d’accompagnement sont également très différents selon que l’équipe projet dispose ou non de compétences informatiques et/ou documentaires et de temps nécessaire pour ces tâches sur l’ensemble de la démarche. Cet accompagnement se déploie également dans des structures partenaires, comme par exemple le BnF DataLab inauguré en octobre 2021 (cf p. 8-9).
En septembre 2021, l’équipe d’Huma-Num a organisé une Action nationale de formation (ANF) intitulée « Gérer ses données en SHS avec les services et outils proposés par la TGIR Huma-Num »5. Cette formation, entièrement disponible en ligne, fournit aux projets de recherche les moyens de se préparer aux enjeux scientifiques qui nécessitent la « FAIRisation » des données produites. Composée de 6 modules, la formation aborde les différents aspects liés à la gestion du cycle de vie de l’information et articulés autour de l’entrepôt de données Nakala.
Développer la qualité des données
Si les services d’Huma-Num permettent la mise en œuvre technique de la majorité des principes FAIR – gestion d’identifiants, gestion de métadonnées, protocoles ouverts et interopérables – il n’en reste pas moins nécessaire d’assister les utilisateurs dans le rôle qu’ils ont à jouer pour rendre intelligibles leurs données sur le long terme (organisation des données, transfert dans un entrepôt, description, réalisation d’une éditorialisation). Pour répondre à ces objectifs, l’équipe d’Huma-Num, en comité interne, analyse chaque demande d’utilisateurs selon plusieurs aspects : identification des besoins informatiques et documentaires, orientation vers d’autres sources d’informations pertinentes le cas échéant, détermination de la nature de l’aide à apporter. En outre, Huma-Num s’inscrit dans le mouvement collectif des infrastructures françaises – notamment Open Edition Center, Métopes, le CCSD, Persée – ayant vocation à développer l’interopérabilité entre les services de chaque partenaire pour contribuer à une meilleure diffusion des données de la recherche. Huma-Num accompagne l’évolution des pratiques de la recherche en SHS, induite par sa numérisation croissante. Il s’agit dorénavant de proposer un accompagnement dans l’utilisation des outils proposés afin d’optimiser la qualité des données et métadonnées associées en s’appuyant sur l’expertise des communautés via le dispositif des consortiums Huma-Num. Ces activités et orientations s’inscrivent pleinement dans la dynamique nationale actuelle en faveur de la science ouverte et des initiatives portées par le programme « Recherche data gouv »6.
L’infrastructure DARIAH : les humanités numériques à l’échelle européenne
Dariah (Digital Research Infrastructure for the Arts and Humanities) est une infrastructure européenne, de type ERIC (European Research Infrastructure Consortium) pour les sciences humaines et sociales qui regroupe 20 pays membres à part entière et un observateur. Chaque pays contribue à Dariah, constituant ainsi un ensemble de services associés à des réseaux d’expertises qui sont à disposition des communautés nationales. En voici quelques exemples :
• Trouver et partager des outils, services et autres ressources sur le SSH Open Market Place développé dans le cadre du projet SSHOCa.
• Trouver et partager des ressources pédagogiques sur Dariah Campus.
• Trouver et partager des cursus universitaires en humanités numériques au niveau européen en consultant le DH Course Registry géré par les infrastructures Dariah Clarin.
• Participer aux activités des nombreux Working Group qui traitent de thématiques diversifiées et proposer d’en créer un le cas échéant.
Huma-Num, qui est l’institution coordinatrice pour la France, a pour mission de fournir les informations nécessaires sur Dariah et d’accompagner les interactions et échanges avec cette infrastructure.