L’archivage comme dispositif de transformation de la nature intrinsèque des objets nativement numériques

DOI : 10.35562/balisages.282

Abstracts

L’article se propose d’interroger les enjeux liés à l’archivage des objets nativement numériques qui se caractérisent par leur instabilité structurelle. Comment évaluer le degré de fiabilité et d’authenticité de documents dépourvus d’une forme et d’un contenu stables ? Comment et à quelles conditions les reconnaître comme document d’archives ? L’archivage (au sens de transfert des objets nativement numériques du dispositif informatique dans lequel ils ont été produits et sont maintenus dans un dispositif de conservation) n’est-il pas de nature à transformer leur statut dynamique ?

The aim of this paper is to examine the challenges pertaining to the preservation of born-digital objects, given that structural instability is one of their distinctive traits. In the case of such records – which are devoid of stability both in form and content – how can their degrees of reliability and authenticity be effectively assessed? How do you appraise such records and decide which ones are to be retained as archival material? In addition, does not digital preservation itself – that is to say, the process of transferring born-digital objects from the digital environment in which they were created to a digital repository) necessarily entail a transformation of their dynamic status into a more static one?

Index

Mots-clés

archivage électronique, document d’activité, document d’archives, archives, enregistrement, préservation

Keywords

born-digital objects, records

Outline

Text

La notion de fixité1 est au cœur de la pratique archivistique professionnelle : les documents d’archives sont transférés dans un dispositif d’archivage lorsqu’ils ont atteint leur état définitif, c’est-à-dire qu’ils ne sont plus modifiés par leur auteur et l’une des fonctions d’un système d’archivage électronique est de s’assurer que les objets numériques archivés ne sont pas modifiés ni modifiables. Le corpus réglementaire français sur l’écrit électronique s’est construit sur cette même logique : la démonstration de la stabilité d’un écrit électronique est l’une des conditions de la reconnaissance de sa valeur probante introduite par la loi n° 2000-230 du 13 mars 2000 portant adaptation du droit de la preuve aux technologies de l'information et relative à la signature électronique2. Or, le numérique vient bousculer la stabilité inhérente au document d’archives sur support papier : le support n’est plus en capacité de garantir la fixité du document d’archives et les objets nativement numériques ont justement comme qualité intrinsèque d’être instables. Le document d’archives numérique est dès lors pris dans une double instabilité, de sa forme et de son contenu informationnel. Et les modifications apportées à un contenu informationnel ne sont plus enregistrées de manière visible sur le support mais dans un dispositif de traçabilité invisible a priori du lecteur.

Dans cet article, nous nous proposons de questionner l’archivage des objets nativement numériques. Nous définissons3 l’archivage comme la décision et l’action d’extraire un objet numérique de son environnement de création pour le transférer dans un dispositif de conservation4. Nous nous demanderons dans quelle(s) mesure(s) l’archivage est de nature à transformer le statut dynamique des objets nativement numériques. Penser l’archivage comme un dispositif de transformation peut sembler déroutant car le processus d’archivage vise à garantir la durabilité dans le temps des objets numériques archivés. Pour discuter ce postulat, nous mobiliserons un cadre théorique issu du dialogue entre les sciences de l’information et de la communication et une approche archivistique basée sur une pratique professionnelle réflexive en tant qu’archiviste.

Dans une première partie, nous définirons, en faisant appel au cadre conceptuel de la diplomatique et de l’archivistique, ce qui caractérise un document d’archives au regard de la situation d’un document au sens de la théorie du document. Dans une deuxième partie, nous convoquerons le concept de fixité pour qualifier le document d’archives comme enregistrement (au travers d’une forme fixe et d’un contenu stable). Dans une troisième partie, nous discuterons de la stabilité informationnelle des objets nativement numériques en mobilisant les concepts de « variabilité limitée » et de « traçabilité » que nous confronterons à des cas d’usages observés dans notre pratique professionnelle : comment reconnaître une forme fixe et un contenu stable dans un objet dynamique ? Ces éléments de définition posés, nous explorerons, dans une quatrième partie, l’impact de l’archivage sur le statut dynamique des objets nativement numériques en questionnant l’existence des données indépendamment du document.

Qu’est-ce qu’un document d’archives ?

Nous proposons ici une définition du document d’archives telle que partagée et formulée dans la littérature professionnelle. Il s’agit pour nous de mettre en évidence les caractéristiques intrinsèques du document d’archives qui est, pour les professionnels des archives, plus qu’un « simple » document. Le document d’archives est en effet caractérisé par le fait qu’il est le produit d’une activité dont il porte trace. Et, par ce fait même, il possède une forme qui lui donne l’aspect qui répond à sa fonction [Delmas, 1996].

Le document d’archives ou document d’activité n’est pas n’importe quel document

Pour les professionnels des archives, les archives sont « l'ensemble des documents, y compris les données, quels que soient leur date, leur lieu de conservation, leur forme et leur support, produits ou reçus par toute personne physique ou morale et par tout service ou organisme public ou privé dans l'exercice de leur activité. »5 Comme tout document, les archives sont constituées d’un support (parchemin, papier, bande magnétique, etc.) et de l’information qu’il porte (qui peut être écrite, sonore, électromagnétique, numérique ou visuelle). La définition des archives « n’exclut aucune période, aucune typologie documentaire, aucun support, dès lors que les documents découlent de l’activité de leur producteur institutionnel ou privé » [Nougaret, 2004]. La notion d’activité se traduit dans la pratique archivistique par le principe de respect des fonds. Et un fonds se définit comme un « ensemble de documents de toute nature constitué de façon organique par un producteur dans l'exercice de ses activités et en fonction de ses attributions »6. Les archives, comme ensemble de documents sont « en quelque sorte la manifestation causale et non intentionnelle » [Bachimont, 2017].

Le document d’archives ne fait sens et ne peut être le témoignage de la réalité d’un fait ou d’un événement que parce qu’il est inséré dans un réseau formé par l’ensemble des documents produits ou reçus par un producteur dans le cadre de ses activités : la constitution du fonds d’archives est concomitante du processus de décision [Nougaret, 2004]. Ce lien organique entre l’activité et les archives s’exprime dans deux caractéristiques des archives que sont la forme et le lien archivistique.

La forme est « l'ensemble des éléments externes et internes (relatifs au contexte, au contenu et à la structure) d'un document qui lui donnent l'aspect qui répond à sa nature diplomatique et juridique, c'est-à-dire à sa fonction, selon les règles et les usages de l'institution qui l'établit » [Delmas, 1996]. La diplomatique7 distingue traditionnellement la forme matérielle de la forme intellectuelle. La forme matérielle renvoie aux caractères externes d’un document ou « caractères liés au document en tant qu’entité physique ou visuelle » [Mas, 2015]. Ces caractères déterminent l’apparence physique du document et permettent de dater le document, d’établir sa provenance et de qualifier son authenticité. Il s’agit de l’analyse du support matériel, de la forme graphique (les polices de caractère, le format, ou l’usage de couleurs, par exemple), des annotations avec la présence de tampons et des éléments de validation et d’authentification, comme les signatures. La forme intellectuelle renvoie, quant à elle, aux caractères internes, c’est-à-dire aux caractéristiques de représentation du contenu informationnel : les modes d’expression du contenu (texte, graphiques, images), les éléments de la rédaction et leur agencement (la langue, les formules, le vocabulaire, le style) et les ajouts, sous forme d’additions, qui sont apportés au contenu après l’élaboration de celui-ci. L’analyse de la forme intellectuelle permet d’évaluer le caractère complet du document. Les informations inscrites sur un support forment donc un ensemble d’informations organisées [Delmas, 1996]. Pour un contexte d’activité donné, l’agencement des informations entre elles est généralement fixé par la loi ou le cadre réglementaire. C’est par exemple le cas des délibérations des collectivités locales qui, pour être perçues et reconnues comme délibération, doivent obligatoirement contenir les informations suivantes : le jour et l'heure de la séance, le nom du président de séance, les noms des conseillers présents et représentés, l'affaire débattue et le résultat du vote et la décision prise à la suite du résultat8.

Le document d’archives a une nature propre qui ne dépend ni de son support, ni de sa date, ni de son contenu informationnel et qui se traduit par sa forme diplomatique. Il est le résultat de l’action d’une personne ou d’une organisation et est, à ce titre, pris dans un réseau de relations organiques avec les autres documents produits dans le cadre d’une activité.

Le document d’archives comme ensemble d’informations organisées

Les archives sont en effet composées de documents et de leurs relations. Dans la théorie archivistique, ce réseau relationnel trouve sa traduction dans le concept de liens archivistiques, développé notamment par Luciania Duranti dans le cadre du projet InterPARES9.

Le lien archivistique désigne ainsi « les relations que, du fait des circonstances de leur production, les documents ont avec leur producteur, avec l’activité à laquelle ils participent et entre eux » [Duranti et Thibodeau, 2006]. Le lien archivistique est qualifié d’originel (parce qu’il naît quand le document est produit ou reçu), de nécessaire (le document est nécessairement produit pour et par l’action d’une personne) et déterminé parce que caractérisé par la finalité du document. Les documents d’archives se répartissent généralement entre quatre catégories [Mas, 2015] : le document dispositif (la documentation précède l’action) qui permet d’établir l’existence d’une action à venir (par ex. le dossier d’admission à l’hôpital), le document probatoire (l’action précède la documentation) qui permet d’attester un fait en apportant une preuve a posteriori d’une action achevée (par ex. l’acte d’état civil), le document à l’appui d’une action (par ex. les notes de cours d’un enseignant, le contenu d’une base de données) et le document narratif qui mémorise une action mais ne participe pas formellement à sa réalisation (par ex. un message électronique pour convenir d’un rendez-vous) ; les deux premières catégories renvoient à des actes juridiques et donc à des actes écrits qui doivent répondre à des règles de présentation strictes et précises, ce qui n’est pas le cas des deux autres catégories.

Le lien archivistique est aussi « le lien qui unit chaque document au document précédent et au document suivant participant à la même activité » [Maftei et McAndrew, 2000]. Dans le cas de documents traditionnels, ce lien est implicite car il se manifeste dans le classement matériel des documents : la copie de la réponse est conservée avec la demande de renseignements ; la preuve (papillon rose) de la réception d’un courrier envoyé par voie recommandée est agrafée à la copie du courrier envoyé ; la décision d’attribution d’une subvention est jointe au dossier de demande de subvention. Le lien peut se manifester aussi dans le code de classement attribué au document. Les délibérations des collectivités doivent par exemple réglementairement recevoir une codification composée du millésime de l’année et d’un numéro incrémental.

Si l’on veut que le document soit la preuve de ce qu’il relate [Bachimont, 2017], la conservation de la trace du lien entre les documents et avec l’activité qui les a produits est essentiel. Ainsi, la description archivistique vise à « identifier et expliquer le contexte et le contenu des documents d'archives » [Conseil international des archives, 1999]. Les liens archivistiques s’expriment sous la forme de relations hiérarchiques (appelées niveaux de description), organisées en cinq niveaux, du multiple au singulier (le fonds, le sous-fonds, la série organique, la sous-série organique, le dossier et la pièce), comme vient l’illustrer le schéma ci-après issu de la norme générale et internationale de description archivistique, ISAD(g).

Figure 1. Représentation des liens archivistiques dans la norme de description internationale ISAD(g)

Image

Source : Norme de description internationale ISAD(g) publiée par le Conseil international des archives : < https://www.ica.org/fr/isadg-norme-generale-et-internationale-de-description-archivistique-deuxieme-edition >.

La structuration de la description reflète quant à elle la composition interne de l’ensemble documentaire auquel appartient le document d’archives. C’est l’usage raisonné et normé de la ponctuation qui permet de représenter les relations hiérarchiques entre les documents : le point permet de séparer des ensembles documentaires de même niveau, par exemple des sous-dossiers et de les inclure, tout en les distinguant du dossier auquel ils appartiennent qui lui est matérialisé par l’usage du « point-tiret » [Conseil international des archives, 1999].

Le document d’archives n’est donc pas n’importe quel document [Chabin, 2017]. Il a une nature propre qui le distingue du « simple » document : c’est un ensemble d’informations structurées et validées qui sont insérées, de manière consubstantielle, dans un réseau de relations, dès qu’elles sont créées [Delmas, 1996]. Le document d’archives fait sens au travers des liens qui tissent un réseau contextuel avec les autres documents créés ou reçus dans un processus d’activité. C’est notamment parce que le document peut être qualifié de document d’archives et reconnu comme authentique inséré et appréhendé dans ce réseau relationnel.

Le document d’archives comme enregistrement : la forme fixe

Compte tenu de sa nature, le document d’archives possède des caractéristiques d’authenticité, de fiabilité et d’intégrité [ISO, 2016]. Comment reconnaître le caractère authentique d’un document d’archives ? Pour répondre à cette question, nous convoquerons le concept de fixité que nous définirons en nous appuyant sur les travaux du projet InterPARES et analyserons au travers du premier cas de jurisprudence relatif à la valeur de l’écrit numérique. Puis nous questionnerons la pertinence de ce concept appliquée aux objets nativement numériques.

Le concept de fixité comme mesure de l’authenticité du document d’archives

L’authenticité renvoie au fait qu’un document d’archives peut prouver qu’il est bien ce qu’il prétend être, qu’il a été créé ou envoyé par l’acteur qui prétend l’avoir créé ou envoyé et qu’il a été créé ou envoyé au moment prétendu. Un document d’archives est fiable parce que son contenu peut être considéré comme la représentation complète et exacte des opérations, activités ou faits qu’il atteste. Quant à l’intégrité, elle renvoie au caractère complet et non altéré de l’état d’un document d’archives. Ces trois caractéristiques reposent sur une logique d’enregistrement. Dans une approche archivistique, l’enregistrement renvoie à un double mécanisme avec, d’une part, l’enregistrement par inscription de l’écrit sur un support et d’autre part, l’enregistrement par fixation de la structure de l’écrit dans une forme documentaire fixe. C’est ce double mécanisme d’enregistrement qui est à même de garantir l’authenticité du document d’archives et autoriser son usage à titre de preuve10 car il permet de maintenir le document dans son état originel en garantissant à la fois la stabilité de son contenu et la fixité de sa forme. Le lecteur a ainsi la certitude de la complétude et de la non-modification du document : « l’intégrité du document et sa permanence sont les gages de l’authenticité » [Bachimont, 2017].

La complétude est l’une des propriétés de l’authenticité. Un document d’archives complet est un document qui possède tous les éléments de forme requis par le système juridique dans lequel il est produit. C’est en effet parce qu’il est la représentation « complète et exacte des opérations, activités ou faits qu’il atteste » [Maftei et McAndrew, 2000] qu’un document d’archives peut être considéré comme fiable. Le caractère complet d’un document se déduit de l’analyse de sa forme documentaire qui possède, comme nous l’avons vu précédemment, des caractères internes et externes. Pour qu’un document d’archives soit considéré comme complet, il doit comporter les éléments suivants : un auteur et un destinataire, une date (date de création, de transmission, de réception), une provenance, une description de l’action ou de l’affaire, des marques de validation (signature, visa, tampon et logo)11. La notion de complétude est incluse dans ce que les chercheurs associés au projet InterPARES définissent comme la « forme fixe », à savoir une « forme qui ne perd aucun de ses éléments originaux en cours de son processus de stockage et d’extraction » [Maftei et McAndrew, 2000].

Le concept de forme fixe trouve une illustration dans le premier arrêt de la Cour de cassation sur la preuve numérique, en date du 4 décembre 200812. Dans une affaire qui l’oppose à un assuré, la Caisse primaire d’assurance maladie (CPAM) de la Marne doit apporter au juge la preuve qu’elle a bien rempli son obligation d’information. N’ayant pas conservé le double du courrier envoyé en 2003, la CPAM produit une copie par réimpression, en 2004, d’un enregistrement informatique daté, lui, de 2003. Dans son jugement, la Cour de cassation considère que le document produit par la CPAM n’est pas digne de confiance. La Cour convoque deux arguments pour rejeter le caractère fiable du document produit par la CPAM : l’absence de signature et l’absence de fidélité de la copie à l’original. L’absence de fidélité s’explique par le fait que la CPAM a réimprimé le courrier sur un papier à en-tête de 2004 : or, le logo de la CPAM de 2004 était différent de celui de 2003. Par son jugement, la Cour de cassation précise la notion de fidélité : une copie fidèle est une copie qui doit « visuellement se présenter comme l’original, avec les indications du papier à en-tête et la signature de l’expéditeur » [Renard, 2009]. La fidélité a depuis été définie comme la « reproduction à l’identique de la forme et du contenu de l’acte »13. La normalisation est venue aussi préciser le concept de fidélité en distinguant la fidélité formelle de la fidélité informationnelle qui « garantit l’identité des contenus et donc du sens, en s’affranchissant éventuellement d’éléments tels les fonds de page ou le libellé des champs d’un formulaire »14.

Un document d’archives est en effet un document dont la forme et le contenu sont restés les mêmes au cours du temps : « dire de quelque chose qu’il est stable, cela veut dire qu’il ne se modifie/dégrade peu ou pas sous l’action d’une turbulence extérieure ou qu’il parvient à maintenir constant un état interne par lui-même, que sa structure, sa morphologie et sa (ses) fonction(s) ne se déforment pas, sous l’effet de l’entropie qui frappe tout système » [Robert, 2010]. Dans sa dimension temporelle, la fidélité trouve une traduction dans le concept d’intégrité. L’intégrité d’un document d’archives renvoie en effet « au caractère complet et non altéré de son état » [ISO 15489, 2016].

Dans l’environnement traditionnel, cette stabilité est assurée par le support. Elle est « par définition même, à la fois matérielle et informationnelle : l’intégrité de l’information que le document porte dépend de celle de son support » [Robert, 2010]. Toute forme d’altération du contenu est enregistrée sur le support et toute dégradation du support se traduit par une altération du contenu. L’exemple de la pratique notariale en est une bonne illustration. Lorsque les parties sont réunies pour la signature d’un acte, le notaire fait lecture du contenu de l’acte. Toute correction apportée au contenu de l’acte est enregistrée par inscription sur le support physique : le notaire raye la mention erronée, écrit en marge le texte corrigé puis demande à chaque partie d’apposer sa signature afin de valider la modification. Le support physique de l’acte devient ainsi le lieu d’enregistrement de toutes les modifications apportées au contenu : « le contenu, la forme et l’unité du document [papier] sont intégrés et manifestes dans l’inscription physique sur un support » [Duranti et Thibodeau, 2006]. Le contenu est inextricablement lié au support qui devient ainsi une caractéristique maîtresse de l’authenticité, en ce sens que le document traditionnel appréhendé par le lecteur est « exactement ce qui est inscrit sur le support physique, comme inscrit » [Duranti et Thibodeau, 2006]. Le concept de fixité peut donc être vu comme une forme d’étalon pour mesurer le caractère authentique (et par là même fiable et intègre) d’un document d’archives. Ce concept demeure-t-il opérant pour caractériser un document d’archives numérique ?

Le concept de fixité à l’épreuve du numérique

Au travers de l’étude de l’évolution de la production documentaire de l’administration (des années 1970 à aujourd’hui) et de l’évolution du corpus normatif qui encadre l’archivage électronique, nous interrogerons la manière dont les professionnels des archives ont continué à mobiliser le concept de fixité. Un basculement conceptuel s’opère en effet au début des années 2000, au moment où le support matériel n’est plus mobilisé comme support de l’intégrité du contenu informationnel qu’il porte.

La première vague d’informatisation des procédures administratives a été sans conséquence sur le régime documentaire et la nature du document d’archives électronique. Le fichier bureautique qui s’est petit à petit substitué au document traditionnel sur support papier demeure un objet perceptible qui possède une finitude spatiale et une finitude temporelle : il reste une inscription fixée et délimitée, dans le temps et l’espace [Bachimont, 2017].

Le récit15 des premières expériences d’archivage électronique aux Archives nationales avec le Projet Constance16, dans les années 1980, conforte cette position. Les premières archives électroniques prises en charge sont des fichiers statistiques, les fichiers du recensement annuel des accidents corporels de la circulation routière de 1962 à 1972. Ces fichiers informatiques contiennent des données statiques, c’est-à-dire des données qui ne seront plus modifiées car les enquêtes statistiques auxquelles elles se rapportent sont terminées. Par ailleurs, lors de la prise en charge des fichiers, les archivistes s’assurent de la cohérence entre la description des données dans la documentation et le contenu des fichiers eux-mêmes : « Il est nécessaire de procéder à deux sortes de vérifications ; l'une concerne la forme de chaque information considérée isolément : par exemple, une donnée décrite comme numérique et codifiée de 1 à 3 ne doit pas présenter la valeur 4 ou une lettre ; l'autre contrôle concerne la cohérence des informations entre elles : un numéro de département doit correspondre au numéro de région qui lui est associé, la description d'un accident survenu en janvier peut présenter une chaussée dont la surface est codifiée comme enneigée, un accident déclaré mortel doit comptabiliser au moins un mort, etc. » [Conchon, 1988]. Enfin, les conditions mêmes de conservation des fichiers, par enregistrement sur bande magnétique, participent à la stabilisation du contenu. Ces fichiers statistiques satisfont donc clairement aux conditions requises de forme fixe et de contenu non modifiable. Très vite, les Archives nationales prennent en charge des fichiers informatiques plus complexes parce qu’issus des bases de données de l’Insee relatives aux recensements de la population. L’archivage présuppose ici l’extraction de tout ou partie des données enregistrées en base de données, sous la forme de fichiers dits « à plat » et leur enregistrement sur bande magnétique [Conchon, 1988]. L’acte d’extraire les données a pour effet immédiat de clore la base de données et de lui donner une dimension temporelle statique. L’enregistrement des fichiers sur un support matériel (ici la bande magnétique) vient renforcer la stabilité informationnelle des contenus extraits. Au travers de ces deux exemples, on le voit, le support matériel, même avec le développement de l’informatique, demeure un élément constitutif de l’authenticité du document d’archives.

La première norme française sur l’archivage électronique17, publiée en 1999, vient confirmer le rôle du support matériel d’enregistrement des documents numériques comme dispositif de démonstration de l’intégrité des informations enregistrées. La non-modification du contenu et la fixité de la forme du document numérique reposent en effet sur l’enregistrement des documents sur un support dit WORM ou non réinscriptible car, précise la norme : « le contenu d’un enregistrement stocké sur disque optique WORM ne peut pas être modifié » et il n’est pas possible « d’effacer une information une fois qu’elle est enregistrée sur un tel disque ou d’en enregistrer une autre à la même place que la précédente ». Le support WORM est en effet défini, toujours dans la norme NF Z42-013(1999) comme « un support optique pour lequel l’écriture des bits codant les données se fait par transformation irréversible d’un ou plusieurs constituants de ce support ». Sur un support de type WORM, l’information est écrite une fois par un processus de modification physique et irréversible du support. Le document est donc stocké en tant que tel, c’est-à-dire en tant qu’inscrit. Le support WORM apparaît comme la transposition, dans l’environnement numérique, du support papier.

En introduisant, dix ans plus tard, la possibilité de stocker des documents d’archives sur des supports dits réinscriptibles, la norme NF Z42-013 (2009) ouvre le champ à un basculement conceptuel. Un support réinscriptible est en effet un support qui permet l’enregistrement, la modification ou la suppression des données enregistrées sans modification du support. L’enregistrement du document sur un support matériel n’est donc plus désormais vu comme la condition sine qua non pour assurer la stabilité du contenu et la fixité de la forme dans le temps car le support ne porte plus la marque des modifications portées au contenu. Dans ces conditions, le support n’est plus un facteur pertinent pour évaluer l’authenticité d’un document électronique. Il ne peut donc plus être regardé comme un élément constitutif du document ; il devient un « élément de son contexte technologique » [Duranti et Thibodeau, 2006]. Pour répondre à ce changement, les rédacteurs de la norme introduisent le concept de WORM logique qu’ils définissent comme un support réinscriptible associé à un dispositif matériel ou logiciel qui interdit la modification ou l’effacement d’une information. Il est intéressant de noter qu’à la même époque (en 2008), le législateur fait évoluer, à la marge, la définition des archives en supprimant le qualificatif « matériel » associé au support18.

L’intégrité d’un document d’archives se traduit désormais par une empreinte, c’est-à-dire une suite de lettres et de chiffres associée de manière univoque à un ensemble informationnel. Ce contrôle a posteriori est réalisé par un calcul algorithmique appelé fonction de hachage19. Le dispositif d’empreinte, comme calcul algorithmique appliqué à un contenu, permet de vérifier que le contenu d’un document est resté intact, dans le temps, toute modification du document entraînant automatiquement une empreinte différente. Le document d’archives numérique demeure un contenu enregistré sur un support. Pour autant, ce n’est plus un objet matériel qui est conservé mais un enregistrement. L’intégrité de l’information ne repose donc plus sur l’intégrité matérielle du support : il s’agit de penser autrement le concept de fixité.

Stabilité informationnelle et objets numériques dynamiques

Si le concept de stabilité informationnelle est facilement appréhendable pour les documents numériques que l’on peut qualifier de statiques, tels que les fichiers bureautiques, il est plus complexe pour les documents numériques dynamiques ou interactifs qui se définissent précisément par leur instabilité structurelle. Comment, dans ces conditions, évaluer le degré de fiabilité et d’authenticité de documents dépourvus de stabilité ? Comment reconnaître une forme fixe ? Pour répondre à ces questions, nous convoquerons deux concepts, celui de « variabilité limitée » et celui de « traçabilité ».

Le concept de « variabilité limitée »

Les bases de données créées et utilisées dans l’administration se sont complexifiées et sont devenues de plus en plus riches et sophistiquées [Banat-Berger, 2010]. Le basculement de l’informatisation vers la « dématérialisation » et l’e-administration ont petit à petit modifié les pratiques de production et de conservation des documents dans une certaine forme d’impensé des questions liées à la fiabilité, à l’exactitude et à l’authenticité.

L’administration conservait généralement une copie du document remis à un destinataire, un demandeur d’une aide ou d’une subvention par exemple. Avec la « dématérialisation », cette pratique de conservation des documents s’est étiolée : pourquoi conserver un document qui ne fait que réagencer des données disponibles dans le système d’information ? D’aucuns y verront l’opportunité de faire des économies en termes de coûts de stockage.

Dans les faits, cette situation n’est pas sans poser des difficultés car les systèmes d’information n’ont pas été pensés pour gérer la stabilité informationnelle des données enregistrées. Au contraire, parce qu’il s’agit de systèmes dynamiques, ils assurent la mise à jour des données enregistrées. Par ailleurs, lorsque ces données sont des données à caractère personnel, elles doivent être des données exactes c’est-à-dire non « périmées » et donc nécessairement à jour : les données disponibles dans le système d’information doivent refléter la réalité de la situation du demandeur. La réglementation sur la protection des données à caractère personnel récemment renforcée avec le Règlement général sur la protection des données personnelles (RGPD)20, dispose à cet effet d’un droit de rectification pour venir corriger des données inexactes21.

Les systèmes autorisent donc la mise à jour, le remplacement, la modification ou la suppression des données mais ne permettent pas « d’historiser » les données et donc de garder les données dans leur valeur avant écrasement. Concrètement, cela se traduit par l’impossibilité de reproduire à l’identique (dans son contenu informationnel et dans sa forme) un document adressé à un bénéficiaire. Techniquement, le document peut, certes, être reproduit mais les données, parce qu’elles auront été mises à jour, ne seront pas identiques à celles qui figuraient dans le document originel. Le modèle qui définit la forme du document aura pu lui aussi évoluer : changement de logo ou changement de signataire par exemple.

Quelles sont alors les solutions ? L’une des solutions est de conserver les documents numériques générés en automatique par le système informatique, dans un sous-système du système de production spécifiquement conçu pour la conservation. Dans ce cas, la fixation des documents peut se faire par l’activation de l’attribut « lecture seule » et l’ajout de métadonnées [ISO 16175-2, 2019].

Une autre solution est de transférer les documents numériques, dès leur création, dans un système d’archivage électronique, c’est-à-dire un système distinct du système métier.

Une troisième solution est de faire évoluer le système d’information métier de sorte à ce qu’il puisse reproduire à l’identique un document. Ici, ce n’est pas le document, comme inscrit qui est conservé mais la capacité de reproduire cet objet dans le temps. Cette solution suppose, d’une part, la conservation contextualisée, c’est-à-dire avec la date de modification des données écrasées, ainsi que des variations successives des modèles de documents avec la constitution d’une collection datée des modèles utilisés. Et, d’autre part, de définir ou renforcer les procédures métiers de saisie des données et de production des documents, procédures qui, dans une approche orientée Records management, sont gages de fiabilité22. Ces règles, parce qu’elles sont de nature à conférer au document une « variabilité limitée »23, autorisent à considérer le document reproduit comme un document d’archives, c’est-à-dire un document dans lequel on a confiance car on aura pu démontrer la stabilité de son contenu et la fixité de sa forme. Ces évolutions des systèmes métiers sont très difficiles à mettre en œuvre car elles présupposent que les concepteurs et développeurs de ces systèmes ainsi que les métiers concernés ont une vision du cycle de vie des documents qui prennent en compte non seulement la création des documents mais aussi leur conception et leur conservation… ce qui n’est pas, pour ne pas dire jamais, le cas. Les études de cas menés dans le cadre du projet InterPARES l’ont confirmé : « la production de documents d’archives dans l’environnement numérique n’est quasiment jamais guidée par des considérations de conservation sur le long terme […] Ce qui, naturellement, n’est pas sans conséquences. Ces documents ne permettent pas au producteur de satisfaire à ses obligations légales. Le producteur ne peut s’y fier pour référence ou action ultérieure et ils ne constituent pas non plus des sources fiables pour les utilisateurs. Qui plus est, ils ne peuvent être compris dans un contexte historique, portant, par là même, atteinte au rôle traditionnel des institutions de conservation comme les services publics d’archives » [Duranti et Thibodeau, 2006]. Le RGPD a fait émerger le concept de Privacy by design24 afin de prendre en compte dans le développement des applications, les exigences liées à la protection des données à caractère personnel ; il faudrait imposer, sur le même principe, ce que nous appelons des exigences de Lifecycle by design.

Le concept de « variabilité limitée » a permis de renouveler le concept de fixité puisqu’il permet de reconnaître qu’on a toujours affaire au même contenu parce que rien d’essentiel n’a changé dans l’identité25 du document d’archives [Bachimont, 2017]. Il trouve une déclinaison technique dans le mécanisme de traçabilité.

La traçabilité, comme prolongement technique du concept de « variabilité limitée »

La norme NF Z42-013 sur l’archivage électronique définit la traçabilité comme un ensemble de « procédures et de protections [qui] doivent être mises en place afin de contrôler le processus d’archivage, d’empêcher et de détecter les modifications ou altérations ». L’enjeu est celui de détecter et d’empêcher toute modification du contenu informationnel en s’appuyant sur des moyens cryptographiques (calcul d’empreintes) et en constituant un journal (c’est-à-dire un historique) des événements et du cycle de vie des archives. « Tout ce qui intervient sur et autour du document doit être tracé et mémorisé. Ces activités de « journalisation » doivent elles-mêmes faire l'objet de mise en mémoire afin d'être convoquées en cas de contentieux ou d'enquête judiciaire » [Cotte, 2016]. Le mécanisme de traçabilité se trouve ainsi placé au cœur du dispositif de démonstration de l’authenticité du document d’archives.

Le cadre réglementaire de la copie vient confirmer le rôle désormais essentiel de la traçabilité comme garant de la fixité du document d’archives. Le décret n° 2016-1673 du 5 décembre 2016 accorde une présomption de fiabilité à la copie électronique si elle résulte « d'un procédé qui répond à un ensemble d’exigences de traçabilité à la fois du dispositif de numérisation et du dispositif de conservation de la copie numérique »26. Ces exigences de traçabilité s’appuient sur le calcul de l’empreinte de la copie et la conservation de l’empreinte et des traces « propres à éviter toute altération de sa forme ou de son contenu »27. Le décret fait sien le concept de « variabilité limitée » puisqu’il est précisé à l’article 4 que « les opérations requises pour assurer la lisibilité de la copie électronique dans le temps ne constituent pas une altération de son contenu ou de sa forme dès lors qu'elles sont tracées et donnent lieu à la génération d'une nouvelle empreinte électronique de la copie ».

Enfin, la norme ISO 15489 sur le Records management distingue les métadonnées descriptives (relatives à l’objet du document d’archives) des métadonnées de traçabilité qui permettent de décrire l’ensemble des « actions et événements affectant le document tout au long de son existence, en incluant la date et l’heure des actions, les changements apportés et les acteurs entreprenant ces actions ».

En convoquant le concept de traçabilité et ses déclinaisons techniques (calcul d’empreinte, journalisation des événements), les professionnels des archives ont su renouveler leur cadre conceptuel pour penser la fixité des objets nativement numériques par définition instables.

Les systèmes d’archivage électroniques ont été construits sur cette logique de traçabilité : tous les événements affectant un document archivé sont consignés dans un journal qui est lui-même conservé (comme document d’archives) aussi longtemps que les documents auxquels il se rapporte. C’est dans ces conditions que l’archivage est en effet de nature à démontrer la « variabilité limitée » des objets numériques archivés. Mais comment archiver des objets nativement numériques dynamiques dont le contenu informationnel et la forme ne sont jamais par principe stabilisés ? Peut-on archiver des données ?28

Les données existent-elles indépendamment du document ?

Poser la question de l’archivage des données, c’est poser la question du statut de l’archivage, comme dispositif de transformation. En effet, les systèmes d’information ne sont plus aujourd’hui orientés vers la production de documents : le document n’est plus le support de diffusion d’une information à un tiers. L’enjeu aujourd’hui est celui de la circulation des données entre les systèmes d’information. Pour autant, la nécessité d’archiver, c’est-à-dire de conserver la trace d’un événement ou d’un fait demeure. Dans ces conditions, que signifie archiver des données « à la volée » ? Nous interrogerons l’archivage comme dispositif de nature à transformer le caractère dynamique des objets nativement numériques au travers de l’étude de cas de l’archivage des données échangées via une application mobile et de l’analyse des outils conceptuels associés à l’archivage électronique.

Les établissements bancaires ont développé des applications mobiles qui permettent à leurs clients de consulter les mouvements sur leurs comptes et réaliser des opérations bancaires, tel qu’un virement permanent. En deux clics, le client donne ordre à sa banque de réaliser, à une échéance donnée et pour une durée indéterminée, un transfert de fonds de son compte vers un compte tiers. L’ordre de virement, qui est un acte engageant tant pour le client que pour la banque, ne prend donc plus la forme d’un écrit. Il se « matérialise » au travers d’enregistrements dans une base de données et/ou dans des fichiers logs. Pour la banque, conserver et archiver un ordre de virement effectué via l’application mobile présuppose d’identifier au préalable, parmi toutes les traces générées à l’occasion de la transaction réalisée par le client, celles dont l’agrégation permettrait de constituer le contenu d’un ordre de virement et décrire, à l’aide de métadonnées les liens qui existent entre ces différents composants électroniques. Le document d’archives numérique doit être regardé comme un document composite29.

Le schéma suivant, issu de la norme ISO 16175, illustre la manière dont les données contenues dans des tables d’une base de données peuvent être identifiées pour constituer un document d’archives :

Figure 2. Identification des composants d’information (ou données) constituant un document électronique engageant dans une base de données, norme ISO 1675-1 (2019).

Image

Source : Norme ISO 16175, 2019.

Lorsque la trace d’une action (ici l’ordre de réaliser un virement permanent) n’existe pas dans une forme figée sous la forme d’un document, l’archivage électronique est de nature à fixer les données, dans le temps et dans l’espace. Les retours d’expériences et réflexions dans le secteur des archives publiques en France, montrent que l’archivage électronique consiste de manière prioritaire à conserver la mémoire des informations produites et échangées, en tant que trace figée des décisions de l’administration, avant de conserver la mémoire de l’expérience utilisateur ou la mémoire des systèmes techniques [Guyon, 2018].

Archiver des objets numériques dynamiques entraîne de facto leur transformation en objets statiques, même s’il est permis de naviguer à l’intérieur de ces objets. Les Archives fédérales suisses ont développé un logiciel, SIARD (pour Sofware Independant Archiving of Relational Databases)30, afin de faciliter l’archivage des bases de données relationnelles. Le format SIARD permet d’extraire le contenu des bases de données et de décrire tant les fonctions de gestion spécifiques aux systèmes de gestion de base de données relationnels (SGBDR) que les données primaires des bases qu'ils contiennent31. Le contenu de la base de données enregistrée au format SIARD se trouve ainsi figé, en l’état de la base de données à un instant T, mais les données pourront être chargées dans une nouvelle base de données.

Dans ces conditions, l’archivage doit être regardé comme une mécanique d’enregistrement à deux dimensions : par agrégat puis par fixation des composants qui constituent l’objet numérique à préserver. Les composants du document d’archives sont agrégés, enregistrés et décrits à l’aide de métadonnées dans ce qu’on appelle un « paquet d’Objets de données (DataObjectPackageType) »32. Le concept de paquet d’Objets de données est issu du SEDA33, le standard d’échange de données pour l’archivage. Ce concept est un dérivé de ce que le modèle OAIS (pour Open Archival Information System)34 décrit comme un Paquet d’informations. On peut le définir comme un conteneur conceptuel dans lequel on va rassembler un contenu de données, c’est-à-dire l’ensemble des composants du document d’archives et des métadonnées techniques, descriptives et de gestion. Ce paquet d’Objets de données est enserré dans un réseau de métadonnées qui constituent une forme d’infrastructure logique [Cotte, 2016] dont l’objectif est d’agréger un maximum d’informations structurées35 afin de permettre l’interprétation de l’objet numérique et de le reconnaître comme document d’archives, dans le temps. L’archivage électronique repose sur un paradigme, celui de conserver un objet numérique au travers de sa description : « conserver un document numérique consiste à conserver la capacité de le reproduire » [Duranti et Thibodeau, 2006].

Le paquet d’Objets de données est un ensemble documentaire logique, fini et délimité. Les empreintes du paquet d’Objets de données et de chaque composant encapsulé dans le paquet d’Objets de données enregistrées comme métadonnées sont en effet de nature à figer dans l’espace (l’espace du conteneur) et dans le temps (le moment du calcul de l’empreinte) le document d’archives électronique.

Dans sa deuxième dimension, l’enregistrement consiste en l’inscription des composants du document d’archives électronique dans le journal du cycle de vie des archives. Cette inscription est de nature à laisser une trace indélébile dans le système d’archivage par un mécanisme de traçabilité qui repose sur le chaînage des journaux : le journal à J contient l’empreinte du journal à J-1 et l’empreinte du journal à J est enregistrée dans le journal à J+136. Cet enregistrement des composants par inscription notamment de leur empreinte dans un dispositif de traçabilité confirme leur existence comme document d’archives. Ce double enregistrement sur lequel repose l’archivage électronique permet en effet d’offrir « les conditions de possibilité d’une organisation stable/stabilisée » qui est de nature à assurer « la pérennité indispensable à l’exercice d’une fonction techno-sociétale de mémorisation » [Robert, 2010].

C’est donc au moment de son archivage qu’un objet numérique dynamique devient document d’archives, en ce sens qu’il possède désormais une forme fixe (au travers du dispositif logique formé par les métadonnées) et un contenu stable (au travers du dispositif de traçabilité). Pour répondre à l’instabilité consubstantielle au numérique, « la pratique de l'archivage a vu son esprit même changer, passant d'intervention post festum avec le recueil de documents achevés et archivables à une activité de marquage des flux, qui capte le moment précis où une pièce, un document, devient archive et en arrête dès lors un certain nombre de traits caractéristiques qui devront durer autant que l'œuvre ou le document. » [Cotte, 2016]. L’archivage peut dès lors être perçu comme un dispositif de transformation du statut des objets nativement numériques.

Conclusion

Explorer les enjeux de l’archivage électronique des objets nativement numériques suppose de questionner le concept de fixité. La culture numérique du « post-imprimé » renoue en effet avec l’ère de la « scriptoria » [Blouin, 1996] et ce que Bruno Bachimont appelle le régime de la variante [Bachimont, 2017]. Comment dans ces conditions reconnaître qu’on a toujours affaire au même contenu ? Comment s’assurer que la forme et le contenu d’un document d’archives sont restés les mêmes au cours du temps ? Ces questions sont au cœur de la pratique archivistique : les conditions de reconnaissance de la valeur probante d’un écrit électronique reposent en effet sur l’identification de son auteur et sa conservation dans des conditions qui garantissent son intégrité, c’est-à-dire avec l’assurance qu’il n’a pas été modifié depuis le moment où il a été fixé dans son état définitif.

La question de l’état définitif et de l’authenticité des documents (re)devient problématique, comme elle l’était avant l’imprimerie : « la fixité et la stabilité de l’écrit obtenues dans un cadre bien particulier (développement de l’imprimerie, apparition du droit d’auteur, développement des sciences, mise en place d’un ordre documentaire basé sur la classification des connaissances) laissent aujourd’hui leur place à de nouveaux modèles qui, par certains aspects, renouent avec d’anciens modes de connaissance et de pensée » [Nougaret, Banat-Berger, 2014]. Les apports conceptuels issus des travaux d’InterPARES sont à ce titre essentiels. Le concept de « variabilité limitée » permet de surmonter le problème de l’authenticité en insistant sur ce qui fait l’identité du document d’archives, au travers de ses sept composants intellectuels : une action, des acteurs, des liens archivistiques, un contexte, un contenu, un support et une forme37. Il s’agit en effet de reconnaître le document d’archives comme document complet et fiable parmi ses multiples variantes. La mécanique de traçabilité mise en œuvre au sein d’un système d’archivage électronique est, à ce titre, de nature à empêcher ou détecter toute modification ou altération du document d’archives. L’archivage électronique s’apparente à un dispositif de fixation, par enregistrement, de l’identité du document d’archives et des données qui le composent. Et, pour cela, il nous semble qu’il doit être perçu comme un dispositif « d’instauration »38 des données. Il est en effet de nature à transformer le statut dynamique des objets nativement numériques, en les faisant advenir comme document d’archives, c’est-à-dire en leur reconnaissant une forme fixe et un contenu stable.

1 La fixité est définie comme la « propriété de ce qui se maintient ou est maintenu dans un état donné » dans le dictionnaire Trésor de la langue

2 La loi est en effet venue préciser que : « L'écrit électronique a la même force probante que l'écrit sur support papier, sous réserve que puisse

3 Il n’existe pas de définition officielle, au sens de réglementaire, de l’archivage.

4 Le dispositif de conservation (ou d’archivage) peut être soit un sous-système de l’environnement de création du document soit un système disjoint

5 Définition officielle et réglementaire inscrite dans le Code du patrimoine et qui a très peu évolué depuis la première loi sur les archives en date

6 Direction des Archives de France, 2002. Dictionnaire de terminologie archivistique.https://francearchives.fr/file/4f7

7 La diplomatique est la critique formelle d’un document et de son authenticité.

8 La réponse ministérielle n° 111047 du Journal officiel de l'Assemblée nationale du 27 février 2007 précise les mentions obligatoires qui doivent

9 Le projet InterPARES est un projet de recherche international pluridisciplinaire sur la conservation permanente de l’authenticité des documents d’

10 Voir plus haut la définition de l’écrit numérique.

11 Voir l’ontologie définie dans le cadre du projet InterPARES 2 : < http://www.interpares.org/ip2/display_file.cfm?doc=ip2_livre_annexe_22.pdf >.

12https://www.legifrance.gouv.fr/affichJuriJudi.do?oldAction=rechJuriJudi&idTexte=JURITEXT000019879437&fastReqId=851083848&fastPos=4 >.

13 Article 1379 du Code civil issu de l’ordonnance N° 2016-131 du 10 février 2016.

14 Norme NF Z 42-026 : Définition et spécifications des prestations de numérisation fidèle de documents sur support papier et contrôle de ces

15 Le récit des premières expériences d’archivage électronique par les Archives nationales a été fait dans la Gazette des archives, la revue de l’

16 Constance (pour Conservation et stockage des archives nouvelles constituées par l'électronique) est un projet lancé à la fin des années 1970 par

17 Il s’agit de la norme AFNOR NF Z42-013.

18 La loi n° 2008-696 du 15 juillet 2008 a modifié l’article L211-1 du Code du patrimoine qui définit les archives.

19 Une fonction de hachage est « une fonction qui fait subir une succession de traitements à une donnée quelconque fournie en entrée pour en produire

20 Règlement (UE) 2016/679 du Parlement européen et du Conseil du 27 avril 2016 relatif à la protection des personnes physiques à l'égard du

21 RGPD, article 16 : « La personne concernée a le droit d'obtenir du responsable du traitement, dans les meilleurs délais, la rectification des

22 Extrait de la norme ISO 15489 sur le Records management : « Pour générer des documents fiables, tout système produisant des documents doit

23 « Qualité d’un document d’archives dont les présentations documentaires sont limitées et contrôlées par des règles fixes et un ensemble stable de

24 Approche de l’ingénierie des systèmes qui prend en compte la vie privée tout au long du processus. Elle consiste à adapter, dès la conception et

25 L’identité renvoie aux caractères externes et internes essentiels du document d’archives. Ces caractères constituent en quelque sorte un ensemble

26 Décret n° 2016-1673 du 5 décembre 2016 relatif à la fiabilité des copies et pris pour l'application de l'article 1379 du Code civil.

27 Ibid.

28 Le terme « données » a été récemment ajouté dans la définition des archives, par la loi n° 2016-925 du 7 juillet 2016 : <  >. L’objectif du légis

29 Norme ISO 16175 (2019) : Information et documentation - Processus et exigences fonctionnelles applicables aux logiciels de gestion des documents d

30 Voir le site web des Archives fédérales suisses : < https://www.bar.admin.ch/bar/fr/home/archivage/outils-et-instruments/siard-suite.html >.

31 Étude du format SIARD réalisée par les Archives de France : < https://francearchives.fr/file/d5459ac36adafce153008f6decb3985b1dcf9b46/static_416

32https://redirect.francearchives.fr/seda/ >.

33 Le standard d’échange de données pour l’archivage vise à faciliter l’interopérabilité entre le système d’information d’un service d’archives

34 Modèle de référence pour un Système ouvert d’archivage d’information (version française de 2017) < https://public.ccsds.org/Pubs/650x0m2%28F%29.pd

35 Il existe plusieurs schémas de métadonnées, comme METS ou PREMIS par exemple.

36 Le chaînage des journaux est une exigence fixée par la norme NF Z 42-013.

37 Voir l’ontologie proposé par le projet InterPARES : < http://www.interpares.org/ip2/display_file.cfm?doc=ip2_livre_annexe_22.pdf >.

38 Nous empruntons ce terme à Denis Jérôme, Goëta Samuel [2016]. « Brutification » et instauration des données. La fabrique attentionnée de l’Open

Bibliography

AFNOR (2017). Norme NF Z 42-026 : Définition et spécifications des prestations de numérisation fidèle de documents sur support papier et contrôle de ces prestations - Définition et spécifications des prestations de numérisation fidèle de documents et contrôle de ces prestations.

AFNOR (2009). Norme NF Z 42-013 : Archivage électronique - Spécifications relatives à la conception et à l'exploitation de systèmes informatiques en vue d'assurer la conservation et l'intégrité des documents stockés dans ces systèmes.

Bachimont, B. (2017). Patrimoine et numérique : technique et politique de la mémoire. Bry-sur-Marne, France : INA.

Banat-Berger, F. (2010). Les archives et la révolution numérique. Le Débat, 158(1), 70-82. DOI : < https://doi.org/10.3917/deba.158.0070 >.

Banat-Berger, F. et Nougaret, C. (2014). Faut-il garder le terme archives ? « Des archives » aux « données ». La Gazette des archives, n° 233, 7-18. DOI : < https://doi.org/10.3406/gazar.2014.5121 >.

Blouin, F. (1996). Cadre de réflexion pour la prise en compte de la diplomatique dans l'environnement électronique. La Gazette des archives, n° 172, 71-87. DOI : < https://doi.org/10.3406/gazar.1996.3389 >.

Chabin, M.A. (2017). Qu’est-ce qu’un document d’archives. < https://transarchivistique.fr/quest-ce-quun-document-d'archives/ >.

Conchon, M. (1988). L'archivage des fichiers informatiques. Bilan de la mise en œuvre de Constance (1982-1988). La Gazette des archives, n° 141, 61-67. DOI : < https://doi.org/10.3406/gazar.1988.3072 >.

Conseil international des archives (1999). ISAD(G) : Norme générale et internationale de description archivistique. https://www.ica.org/sites/default/files/CBPS_2000_Guidelines_ISAD%28G%29_Second-edition_FR.pdf >.

Cotte, D. (2004). Le concept de document numérique. Communication et langages 140, 2e trimestre. DOI : 10.3406/colan.2004.3265.

Cotte, D. (2016). La culture numérique entre l'appréhension de l'oubli et la fabrication de la mémoire. Kairos, n° 2. < http://kairos.univ-bpclermont.fr/l-oubli/dossier/la-culture-numerique-entre-l-apprehension-de-l-oubli-et-la-fabrication-de-la-memoire >.

Delmas, B. (1996). Manifeste pour une diplomatique contemporaine. Des documents institutionnels à l'information organisée. La Gazette des archives, n° 172, 49-70. DOI : < https://doi.org/10.3406/gazar.1996.3389 >.

Denis, J. et Goëta, S. (2016). « Brutification » et instauration des données. La fabrique attentionnée de l’open data. I3Working Papers Series, 16-CSI-01. < http://i3.cnrs.fr/wp-content/uploads/2016/07/WPi3_16-CSI-01-Denis-Goeta.pdf >.

Duranti, L. et Thibodeau, K. (2006). Le concept de document d’archives dans les environnements interactifs, expérientiels et dynamiques : le point de vue d’InterPARES. (Traduit par Nougaret C., Borgeaud E. et Banat-Berger F.). Archival Science. http://elec.enc.sorbonne.fr/interpares2/annexe2 >.

Guyon, C. (2015). La pratique archivistique publique en France, entre adaptation et négociation : expériences et réflexions d’une archiviste. Les Cahiers du numérique, vol. 11(2), 77-114. < https://www.cairn.info/revue-les-cahiers-du-numerique-2015-2-page-77.htm >.

Guyon C. (2018). L’archivage électronique dans le secteur public, des raisons d’être optimiste ! <  >.

ISO. (2016). Norme 15489 : Information et documentation. Gestion des documents d'activité – Partie 1 : concepts et principes.

ISO. (2019). Norme ISO 16175 : Information et documentation. Processus et exigences fonctionnelles applicables aux logiciels de gestion des documents d'activité.

ISO. (2017). Norme ISO 5127 : Information and documentation. Foundation and vocabulary.

Maftei, M. et McAndrew, I. (2000). Filiation des éléments composant la grille d’analyse (pré-InterPARES) : de la diplomatique médiévale à la diplomatique contemporaine. (Traduit par Nougaret, C. Borgeaud, E. et Banat-Berger, F.). < http://elec.enc.sorbonne.fr/interpares2/interpares1 >.

Mas, S. (2015). Apport des grilles d’analyse de la notion de genre aux études diplomatique et archivistique des documents numériques des organisations. Dans Gagnon-Arguin L., Mas S. et Maurel D. Les genres de documents dans les organisations : analyse théorique et pratique (31-48), Québec, Canada : Presses de l’université du Québec.

Nougaret, C. (2004). Les sources archivistiques. Production organique ou invention de l'archiviste ? Hypothèses, 2004/1, 331-339. DOI : < https://doi.org/10.3917/hyp.031.0331 >.

Renard, I. (2009). Premier arrêt de la Cour de cassation sur la preuve électronique Cour de cassation, Civ. 2, 4 décembre 2008 (pourvoi n° 07-17622). < http://www.microlist.fr/resources/annexe9.pdf >.

Robert, P. (2010). Mnémotechnologies. Paris, France : Lavoisier.

Notes

1 La fixité est définie comme la « propriété de ce qui se maintient ou est maintenu dans un état donné » dans le dictionnaire Trésor de la langue française.

2 La loi est en effet venue préciser que : « L'écrit électronique a la même force probante que l'écrit sur support papier, sous réserve que puisse être dûment identifiée la personne dont il émane et qu'il soit établi et conservé dans des conditions de nature à en garantir l'intégrité ».

3 Il n’existe pas de définition officielle, au sens de réglementaire, de l’archivage.

4 Le dispositif de conservation (ou d’archivage) peut être soit un sous-système de l’environnement de création du document soit un système disjoint, c’est-à-dire indépendant de l’environnement de création.

5 Définition officielle et réglementaire inscrite dans le Code du patrimoine et qui a très peu évolué depuis la première loi sur les archives en date du 3 janvier 1919.

6 Direction des Archives de France, 2002. Dictionnaire de terminologie archivistique.https://francearchives.fr/file/4f717e37a1befe4b17f58633cbc6bcf54f8199b4/dictionnaire-de-terminologie-archivistique.pdf >.

7 La diplomatique est la critique formelle d’un document et de son authenticité.

8 La réponse ministérielle n° 111047 du Journal officiel de l'Assemblée nationale du 27 février 2007 précise les mentions obligatoires qui doivent figurer sur une délibération.

9 Le projet InterPARES est un projet de recherche international pluridisciplinaire sur la conservation permanente de l’authenticité des documents d’archives électroniques. Il vise à développer les connaissances indispensables pour la conservation à long terme de documents authentiques : < http://www.interpares.org/ >.

10 Voir plus haut la définition de l’écrit numérique.

11 Voir l’ontologie définie dans le cadre du projet InterPARES 2 : < http://www.interpares.org/ip2/display_file.cfm?doc=ip2_livre_annexe_22.pdf >.

12https://www.legifrance.gouv.fr/affichJuriJudi.do?oldAction=rechJuriJudi&idTexte=JURITEXT000019879437&fastReqId=851083848&fastPos=4 >.

13 Article 1379 du Code civil issu de l’ordonnance N° 2016-131 du 10 février 2016.

14 Norme NF Z 42-026 : Définition et spécifications des prestations de numérisation fidèle de documents sur support papier et contrôle de ces prestations - Définition et spécifications des prestations de numérisation fidèle de documents et contrôle de ces prestations.

15 Le récit des premières expériences d’archivage électronique par les Archives nationales a été fait dans la Gazette des archives, la revue de l’Association des archivistes français (AAF) : < https://www.persee.fr/collection/gazar >.

16 Constance (pour Conservation et stockage des archives nouvelles constituées par l'électronique) est un projet lancé à la fin des années 1970 par les Archives nationales pour garantir la pérennité des archives informatiques produites par l'État et les opérateurs publics.

17 Il s’agit de la norme AFNOR NF Z42-013.

18 La loi n° 2008-696 du 15 juillet 2008 a modifié l’article L211-1 du Code du patrimoine qui définit les archives.

19 Une fonction de hachage est « une fonction qui fait subir une succession de traitements à une donnée quelconque fournie en entrée pour en produire une empreinte servant à identifier la donnée initiale » (Norme NF Z 42-013, 2009).

20 Règlement (UE) 2016/679 du Parlement européen et du Conseil du 27 avril 2016 relatif à la protection des personnes physiques à l'égard du traitement des données à caractère personnel et à la libre circulation de ces données.

21 RGPD, article 16 : « La personne concernée a le droit d'obtenir du responsable du traitement, dans les meilleurs délais, la rectification des données à caractère personnel la concernant qui sont inexactes. Compte tenu des finalités du traitement, la personne concernée a le droit d'obtenir que les données à caractère personnel incomplètes soient complétées, y compris en fournissant une déclaration complémentaire ».

22 Extrait de la norme ISO 15489 sur le Records management : « Pour générer des documents fiables, tout système produisant des documents doit comporter des procédures métier et des procédures documentaires intégrées, des schémas des métadonnées utilisées, des formes documentaires, une gestion des droits d’accès ».

23 « Qualité d’un document d’archives dont les présentations documentaires sont limitées et contrôlées par des règles fixes et un ensemble stable de données de contenu, de forme et de composition, de sorte que la même action, interrogation, requête ou interaction de l’utilisateur produira toujours le même résultat » (InterPARES).

24 Approche de l’ingénierie des systèmes qui prend en compte la vie privée tout au long du processus. Elle consiste à adapter, dès la conception et par défaut, des mesures organisationnelles et techniques appropriées pour garantir la protection de la vie privée et des libertés fondamentales. < https://fr.wikipedia.org/wiki/Protection_de_la_vie_priv%C3%A9e_d%C3%A8s_la_conception >.

25 L’identité renvoie aux caractères externes et internes essentiels du document d’archives. Ces caractères constituent en quelque sorte un ensemble d’invariants qu’il est indispensable de repérer et décrire.

26 Décret n° 2016-1673 du 5 décembre 2016 relatif à la fiabilité des copies et pris pour l'application de l'article 1379 du Code civil.

27 Ibid.

28 Le terme « données » a été récemment ajouté dans la définition des archives, par la loi n° 2016-925 du 7 juillet 2016 : <  >. L’objectif du législateur était d’affirmer l’appartenance des données numériques au champ des archives. Les archives se définissent désormais comme « l’ensemble des documents y compris les données ». Faut-il voir dans cette formulation un lien de subordination entre document et données ?

29 Norme ISO 16175 (2019) : Information et documentation - Processus et exigences fonctionnelles applicables aux logiciels de gestion des documents d'activité.

30 Voir le site web des Archives fédérales suisses : < https://www.bar.admin.ch/bar/fr/home/archivage/outils-et-instruments/siard-suite.html >.

31 Étude du format SIARD réalisée par les Archives de France : < https://francearchives.fr/file/d5459ac36adafce153008f6decb3985b1dcf9b46/static_4163.pdf >.

32https://redirect.francearchives.fr/seda/ >.

33 Le standard d’échange de données pour l’archivage vise à faciliter l’interopérabilité entre le système d’information d’un service d’archives public et les systèmes d’information de ses partenaires (producteurs, utilisateurs, etc.). Il fournit un modèle pour les différentes transactions qui peuvent intervenir : transfert, communication, élimination, modification et restitution d’archives.

34 Modèle de référence pour un Système ouvert d’archivage d’information (version française de 2017) < https://public.ccsds.org/Pubs/650x0m2%28F%29.pdf >.

35 Il existe plusieurs schémas de métadonnées, comme METS ou PREMIS par exemple.

36 Le chaînage des journaux est une exigence fixée par la norme NF Z 42-013.

37 Voir l’ontologie proposé par le projet InterPARES : < http://www.interpares.org/ip2/display_file.cfm?doc=ip2_livre_annexe_22.pdf >.

38 Nous empruntons ce terme à Denis Jérôme, Goëta Samuel [2016]. « Brutification » et instauration des données. La fabrique attentionnée de l’Open Data.

Illustrations

Figure 1. Représentation des liens archivistiques dans la norme de description internationale ISAD(g)

Figure 1. Représentation des liens archivistiques dans la norme de description internationale ISAD(g)

Source : Norme de description internationale ISAD(g) publiée par le Conseil international des archives : < https://www.ica.org/fr/isadg-norme-generale-et-internationale-de-description-archivistique-deuxieme-edition >.

Figure 2. Identification des composants d’information (ou données) constituant un document électronique engageant dans une base de données, norme ISO 1675-1 (2019).

Figure 2. Identification des composants d’information (ou données) constituant un document électronique engageant dans une base de données, norme ISO 1675-1 (2019).

Source : Norme ISO 16175, 2019.

References

Electronic reference

Céline Guyon, « L’archivage comme dispositif de transformation de la nature intrinsèque des objets nativement numériques », Balisages [Online], 1 | 2020, Online since 24 février 2020, connection on 23 septembre 2021. URL : https://publications-prairial.fr/balisages/index.php?id=282

Author

Céline Guyon

Archiviste et maître de conférences associé, Enssib – Université de Lyon

Copyright

CC BY SA 4.0