<?xml version="1.0" encoding="UTF-8"?><TEI xmlns="http://www.tei-c.org/ns/1.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xi="http://www.w3.org/2001/XInclude" xmlns:ns="http://www.tei-c.org/ns/1.0" xmlns:mathml="http://www.w3.org/1998/Math/MathML" xmlns:loext="urn:org:documentfoundation:names:experimental:office:xmlns:loext:1.0" xmlns:dcr="http://www.isocat.org/ns/dcr" change="metopes_annotation">
  <teiHeader>
    <fileDesc>
      <titleStmt>
        <title type="main">NumaHOP, une plateforme de gestion de contenus
        numérisés</title>

        <author role="aut"><name>Olesea Dubois</name><affiliation>Responsable
        service Numérisation et Archivage numérique à la Bibliothèque de
        Sciences Po</affiliation><idno type="IDREF">24932637X</idno></author>

        <author role="aut"><name>Fanny
        Mion-Mouton</name><affiliation>Responsable adjointe du pôle Flux et
        données à la Bulac</affiliation><idno type="IDREF">159122856</idno><idno type="VIAF">http://viaf.org/viaf/281183258</idno></author>

        <author role="aut"><name>Pauline Rivière</name><affiliation>Chef de
        projet numérisation à la Bibliothèque
        Sainte-Geneviève</affiliation><idno type="IDREF">249326418</idno></author>
      </titleStmt>

      <editionStmt>
        <edition><date>2020-10-06T09:49:00</date></edition>
      </editionStmt>

      <publicationStmt>
        <ab type="papier"><dimensions>
            <dim type="pagination">10-11</dim>
          </dimensions><date>01/10/2020</date></ab>

        <idno type="book"/>

        <ab type="lodel"><date/></ab>
      </publicationStmt>

      <sourceDesc>
        <p>Version Métopes : 2.2</p>

        <p>Written by OpenOffice</p>

        <bibl>Arabesques</bibl>
      </sourceDesc>
    </fileDesc>

    <encodingDesc>
      <tagsDecl>
        <rendition scheme="css" xml:id="none">color:black;</rendition>
      </tagsDecl>
    </encodingDesc>

    <profileDesc>
      <langUsage>
        <language ident="fr-FR"/>
      </langUsage>

      <textClass/>
    </profileDesc>

    <revisionDesc>
      <change when="2020-10-09T12:22:00" who="Marie-Pierre Roux">Révision</change>
    </revisionDesc>
  </teiHeader>

  <text xml:id="text">
    <front>
      <titlePage>
        <docTitle>
          <titlePart style="T_3_Article" type="main">NumaHOP, une plateforme
          de gestion de contenus numérisés</titlePart>
        </docTitle>

        <byline><docAuthor style="txt_auteur">Olesea
        Dubois</docAuthor><affiliation style="auteur_Institution">Responsable
        service Numérisation et Archivage numérique à la Bibliothèque de
        Sciences Po</affiliation><email style="auteur_Courriel"><ref target="mailto:olesea.dubois@sciencespo.fr">olesea.dubois@sciencespo.fr</ref></email><docAuthor style="txt_auteur">Fanny Mion-Mouton</docAuthor><affiliation style="auteur_Institution">Responsable adjointe du pôle Flux et
        données à la Bulac</affiliation><email style="auteur_Courriel"><ref target="mailto:fanny.mion-mouton@bulac.fr">fanny.mion-mouton@bulac.fr</ref></email><docAuthor style="txt_auteur">Pauline Rivière</docAuthor><affiliation style="auteur_Institution">Chef de projet numérisation à la
        Bibliothèque Sainte-Geneviève</affiliation><email style="auteur_Courriel"><ref target="mailto:pauline.riviere@sorbonne-nouvelle.fr">pauline.riviere@sorbonne-nouvelle.fr</ref></email></byline>
      </titlePage>

      <argument>
        <p style="txt_chapo">Projet collaboratif développé en open source,
        NumaHOP offre une chaîne unique, simplifiée et largement automatisée,
        permettant de gérer toutes les étapes d’un projet de numérisation, de
        l’import de notices à la diffusion et à l’archivage.</p>
      </argument>
    </front>

    <body>
      <div type="chapitre" xml:id="mainDiv">
        <p style="txt_Normal">NumaHOP est un projet porté par trois
        établissements pilotes, bibliothèque Sainte-Geneviève, bibliothèque de
        Sciences Po-Paris, Bulac, dans le cadre de la Comue Sorbonne Paris
        Cité, avec le soutien financier du Département de Paris. Investis dans
        différents projets de numérisation, ces trois établissements ont
        rapidement fait le constat de la multiplicité des outils développés
        localement et méconnus des autres bibliothèques, de l’hétérogénéité
        des traitements apportés aux différentes étapes de la numérisation
        suivant les contextes, et de la complexité des différents processus
        engagés. L’idée de développer une chaîne unique, simplifiée et
        largement automatisée pour gérer toutes les étapes des projets de
        numérisation a émergé, après une comparaison des outils existants qui
        ne répondaient pas pleinement aux besoins des bibliothèques. Suite à
        un appel d’offre mené en 2015-2016, le projet de développement a été
        confié à la société Progilone, en étroite collaboration avec les trois
        établissements réunis en groupe métier et en comité de pilotage.</p>

        <div type="section1">
          <head style="T_1" subtype="level1">Un outil intégrateur</head>

          <p style="txt_Normal">L’objectif attendu du projet était triple. En
          premier lieu, le logiciel développé devait être open source pour
          être diffusé, utilisé et amélioré le plus largement possible par
          l’ensemble des établissements intéressés, non seulement dans la
          sphère universitaire et culturelle (bibliothèques, archives, musées)
          mais aussi bien au-delà (associations, entreprises). La plateforme
          de gestion des contenus numérisés devait aussi permettre de gérer,
          en un point d’entrée unique, l’ensemble de la chaîne de
          numérisation, en prenant notamment en compte les étapes d’imports en
          amont, de diffusion en aval, et les interactions avec les éventuels
          prestataires de numérisation. Compte tenu de la diversité des
          utilisateurs envisagés, le logiciel devait être le plus « <hi rend="italic" style="typo_Italique">personnalisable </hi>» possible,
          par les agents métiers, pour répondre aux différents enjeux et
          besoins locaux. Enfin, l’outil devait être accessible le plus
          simplement possible afin de favoriser son appropriation par
          l’ensemble des agents, y compris sur des tâches habituellement
          identifiées comme techniques. Désormais, l’usage quotidien de
          NumaHOP par les équipes des établissements pilotes a permis de
          constater rapidement la simplification des chaînes de numérisation.
          Cette plateforme, accessible en full web, permet en effet de gérer
          toutes les étapes de la chaîne, de l’import des notices et du
          constat d’état des documents physiques à la diffusion et à
          l’archivage grâce à un interfaçage largement automatisé avec les
          différents acteurs impliqués (Abes, prestataires de numérisation,
          bibliothèques, diffuseurs, Cines).</p>
        </div>

        <div type="section1">
          <head style="T_1" subtype="level1">Quatre modules
          fonctionnels</head>

          <p style="txt_Normal">NumaHOP est composé de quatre principaux
          modules fonctionnels. Le premier module constitue l’interface
          d’import. Il permet notamment de convertir automatiquement des
          notices au format Unimarc ou EAD<note n="1" place="foot" style="txt_Note" type="standard" xml:id="ftn1"><p>EAD : Encoded
          Archival Description</p></note><hi rend="bold" style="typo_gras">
          </hi>dans des formats interopérables : Dublin Core, Dublin Core
          qualifié. Les mappings sont personnalisables selon les spécificités
          de chaque établissement. Ce module permet également d’importer les
          fichiers images, qu’ils soient livrés par un prestataire de
          numérisation ou directement produits par l’établissement. Plusieurs
          formats d’image sont pris en charge par NumaHOP : PDF, TIFF, PNG,
          JPG, JP2000, GIF et SVG. Lors de l’import, des contrôles automatisés
          sont réalisés par NumaHOP, permettant de détecter d’éventuelles
          erreurs de formats, de résolution, de compression, de profil de
          couleur, ou de nommage (séquençage, casse). Le second module permet
          la gestion interne des documents, répartis au sein de projets, lots
          et trains. Une interface dédiée à la rédaction de constats d’état
          offre la possibilité de consigner les différents états du document,
          avant et après sa numérisation. Cette interface est paramétrable par
          établissement et offre la possibilité d’utiliser un vocabulaire
          uniformisé et contrôlé. Divers outils de gestion de projets
          (statistiques, tableaux de bord) sont associés à ce module, pour
          faciliter le recueil d’indicateurs d’activités pertinents. Le
          contrôle qualité des images et métadonnées est réalisé au sein d’un
          troisième module. L’implémentation d’une visionneuse adaptée aux
          besoins des contrôleurs permet de vérifier sur un même écran la
          qualité des images produites, les métadonnées qui leur sont
          associées (table des matières, OCR<note n="2" place="foot" style="txt_Note" type="standard" xml:id="ftn2"><p>OCR : Optical
          Character Recognition</p></note>), ainsi que divers points de
          vigilance indiqués dans le constat d’état du document. Lors de la
          conception de NumaHOP, une attention particulière a été portée à ce
          module et à ses performances. La création, en temps réel, par le
          logiciel, de fichiers dérivés dans une résolution adaptée au zoom,
          permet désormais une très grande rapidité d’affichage. Les erreurs
          sont signalées directement depuis l’écran de contrôle et permettent
          l’envoi automatisé au prestataire d’un rapport de contrôle normalisé
          indiquant les vues à reprendre. Enfin, le dernier module concerne
          les fonctionnalités d’export des fichiers images ou métadonnées.
          NumaHOP permet d’exporter de façon automatisée un document, à la fin
          du workflow, à la fois vers une plate-forme de stockage local ou
          d’archivage (Cines), et vers les plates-formes de diffusion (<hi rend="italic" style="typo_Italique">Internet Archive, Omeka</hi>).
          Les fichiers métadonnées attendus pour les différents types
          d’exports (par exemple sip.xml et METS<note n="3" place="foot" style="txt_Note" type="standard" xml:id="ftn3"><p>METS : Metadata
          Encoding and Transmission Standard</p></note><hi rend="bold" style="typo_gras"> </hi>pour le Cines, OCR pour la diffusion) ainsi
          que les fichiers images dérivés sont produits automatiquement lors
          de l’export. Grâce à l’automatisation de ces tâches, les
          établissements peuvent ainsi disséminer largement et de manière
          systématique l’ensemble de leurs contenus numérisés. La mise en
          place d’un workflow configurable, adapté à chaque projet permet de
          guider l’utilisateur à travers ces différents modules, selon son
          profil et ses attributions.</p>

          <figure>
            <graphic url="../icono/br/arabesques_99_dossier_03_numahop_fig01.jpg"/>

            <head style="titre_figure">Périmètre fonctionnel de NumaHOP</head>
          </figure>
        </div>

        <div type="section1">
          <head style="T_1" subtype="level1">Automatiser, fluidifier,
          collaborer et hop !</head>

          <p style="txt_Normal">Quel bilan tirer au terme d’un an
          d’utilisation en production dans les établissements pilotes ? Des
          gains de temps notables ont été observés, en particulier à deux
          étapes de la chaîne de numérisation, auparavant très
          chronophages : la conversion des métadonnées et le contrôle qualité.
          La conversion automatique de données bibliographiques permet de se
          contenter désormais de simples vérifications lors de l’import de
          notices. Les métadonnées produites dans l’application sont conformes
          aux normes (Abes, BnF, Cines, etc.), ce qui offre des fichiers
          d’export directement injectables dans les bibliothèques numériques
          et au Cines. Le contrôle qualité est aujourd’hui plus fiable et plus
          rapide, grâce aux contrôles automatiques exhaustifs à l’import et à
          la performance d’affichage des images. La génération automatique de
          bordereaux normalisés de contrôle a également permis de fluidifier
          les procédures de reprise. Parallèlement, l’utilisation de NumaHOP a
          permis une simplification des appels d’offres, en limitant
          considérablement le nombre de tâches attendues des prestataires de
          numérisation. En 2020, les établissements pilotes ont constaté une
          diminution des coûts des prestations de numérisation de 30 à 60 %
          selon la typologie des documents numérisés. Des prestations variées,
          auparavant dévolues aux sociétés de numérisation (génération de
          fichiers dérivés, création de paquets METS, génération et dépôts
          automatisés des paquets pour l’archivage pérenne au Cines,
          génération de l’OCR) sont désormais prises en charge directement
          dans NumaHOP. Au sein des trois établissements, l’utilisation de
          NumaHOP a permis de recentrer l’activité du prestataire de
          numérisation sur la prise de vue, tout en reprenant la main sur la
          gestion et la production des métadonnées. Ce constat tient notamment
          au fait que l’application dispose d’une interface ergonomique, qui a
          permis une acculturation rapide des personnels, y compris sur des
          tâches auparavant identifiées comme trop techniques. La mise en
          production de NumaHOP a permis de ne plus limiter les tâches liées à
          la numérisation à un petit nombre d’agents aguerris à l’utilisation
          d’outils techniques parfois rebutants au premier abord.
          L’intervention de personnes, issues de services distincts, au sein
          d’un même outil est facilitée par l’utilisation du tableau de bord
          et des possibilités de « <hi rend="italic" style="typo_Italique">reporting </hi>» qui permettent à l’ensemble
          des intervenants d’avoir une vue globale sur l’avancée d’un projet.
          Un des objectifs de NumaHOP réside dans l’utilisation de méthodes de
          travail standardisées, tout en offrant la souplesse d’adapter
          l’outil aux réalités locales. L’instance mutualisée qui dessert les
          trois établissements a ainsi conduit à une harmonisation des
          pratiques, tout en maintenant des paramétrages distincts pour chacun
          des modules par établissement (« mappings », contrôles,
          « workflows », constats, imports, exports etc.).</p>
        </div>

        <div type="section1">
          <head style="T_1" subtype="level1">Et après ?</head>

          <p style="txt_Normal">NumaHOP, dont le code source (<ref target="https://github.com/progilone/numahop"><hi rend="underline" style="typo_souligne">https://github</hi></ref><ref target="https://github.com/progilone/numahop"><hi rend="underline" style="typo_souligne">.com/progilone/numahop</hi></ref>) est sur
          Github, résulte d’une démarche résolument engagée en faveur de
          l’utilisation et du partage d’applications open source. La prise en
          main de cet outil par une communauté d’utilisateurs sera décisive
          pour son développement et son évolution. Une diffusion large de son
          utilisation au sein de la communauté universitaire et de toutes les
          institutions concernées engagerait une démarche partagée
          d’améliorations et d’harmonisation des pratiques, en favorisant la
          mutualisation des savoir-faire et des connaissances.</p>
        </div>
      </div>
    </body>
  </text>
</TEI>