Les documents numérisés en ligne

DOI : 10.35562/arabesques.3269

p. 16-17

Text

Utilisateurs et concepteurs de bibliothèques virtuelles, entre attentes des uns et contraintes des autres, tous acteurs1

Concernant les sciences dures, des outils automatisés d’exploitation de l’information scientifique diffusée sous forme d’articles ou de rapports par les éditeurs commerciaux ou encore dans les nombreuses bibliothèques numériques spécialisées permettraient aux chercheurs – de plus en plus habitués à accéder à tout depuis leur écran – de trier efficacement la surenchère d’une information essentiellement constituée de périodiques qu’il s’agit avant tout de maîtriser. À ce titre, les alertes proposées par les éditeurs commerciaux sont très pratiques en matière de veille scientifique. Pour des recherches précises, le recours à des moteurs de recherche généralistes comme Google Scholar, ou des portails documentaires type ABES, INIST ou d’éditeurs commerciaux, se révèle toujours plus efficace que la consultation isolée de bases de données locales éditrices de l’information recherchée. La gestion et le tri de la pléthore d’informations disponibles demeurent au cœur du problème de l’accès pertinent à l’essentiel de l’information. L’indexation systématique n’est pas assez spécialisée, seule une réindexation personnelle s’avère vraiment significative ; l’outil de classement bibliographique EndNote, certes payant, étant d’un bon secours. Dernier point, un article en ligne ne remplace pas sa version papier annotable, remarque qui actualise plus que jamais l’idée du bureau virtuel qui permettra peut-être un jour d’annoter aussi en ligne après téléchargement. L’indexation spécialisée et les attentes des différents publics restent difficiles à concilier ; les consortiums de négociants permettent aux petits établissements d’offrir une documentation riche aux chercheurs, chose inenvisageable dans une logique d’établissement. Quant au problème du filtrage de l’information, il ne peut être envisager du côté du fournisseur, le chercheur – muni de ses propres critères de filtrage – devant se saisir de l’information dont il valide en définitive les contenus. Comment concevoir donc le rapport de médiation ? Le réflexe du chercheur penche en faveur de son propre camp, seul aujourd’hui en mesure de développer un web-sémantique sur un corpus restreint. L’historien, habitué à la manipulation de documents d’archives, est essentiellement à la recherche de textes normatifs en ligne, par essence les plus difficiles à indexer et qui mettent en œuvre un vocabulaire spécifique – édits, ordonnances, etc. Les recherches sur Gallica, principale ressource pour qui cherche des textes d’Ancien Régime en masse, se sont révélées peu concluantes, malgré une tentative d’élargissement des termes de recherche : une requête lancée sur un terme précis (comme édit) ne renvoie pas un nombre significatif de résultats, tandis qu’une recherche sur le terme générique hôpital renvoie inévitablement du bruit.

La question de l’indexation des documents numérisés est donc relancée : comment faire pour les rendre aisément repérables par ceux qui sont le plus à même de les exploiter ? On rappelle quelques principes mais aussi quelques limites de Gallica : la part d’ouvrages d’Ancien Régime n’y est pas si importante ; pour des raisons de technique de numérisation, ce sont les ouvrages du xixe siècle qui sont surreprésentés – on peut acheter des antiquaria à prix raisonnable, qui ne seront destinés qu’à la numérisation. Il est donc logique qu’un historien de l’Ancien Régime ne trouve pas tout ce qu’il cherche sur le site. L’indexation y est établie à partir de Rameau ; en tant que source d’indexation normalisée, elle permet une interrogation raisonnée du catalogue de Gallica et des requêtes transposables sur d’autres catalogues fonctionnant aussi en Rameau. L’inconvénient de Rameau, c’est qu’il ne semble pas toujours parfaitement adapté à tous les domaines ; il est possible que dans le cas des hôpitaux militaires d’Ancien Régime cette indexation ne soit pas pertinente ! L’historien de la chimie travaille parallèlement sur des sources primaires (ouvrages des xvie aux xviiie siècles) et secondaires (bouquets d’archives Jstor et de périodiques Muse) et considère que la numérisation permet d’abolir les distances, de démocratiser l’accès aux fonds anciens, et de favoriser la découverte de nouveaux ouvrages. La cohérence des corpus numérisés apparaît en revanche rarement en accord avec les publics de lecteurs traditionnels. Il est rappelé alors que les bibliothèques chargées de projets de numérisation n’ont pas de vocation spécifiquement bibliographique et qu’il revient aux portails thématiques d’abolir réellement, même à l’échelle du web, la notion de numérisation en un lieu et de consultation en un autre lieu. Les programmes de coopération manquent encore de souffle, et les frontières linguistiques se posent plus que jamais à l’échelle internationale. Si le projet MICHAEL de plate forme européenne multilingue de ressources culturelles numérisées réunit déjà la France, le Royaume-Uni et l’Italie, aucun portail international de la Francophonie n’est encore envisagé. Le participant au projet PHARE (Pôle d’histoire de l’analyse des représentations économiques) insiste sur la double nécessité de préserver la matérialité visuelle des textes autant que d’en pouvoir interroger le contenu en mode plein texte mis en cache derrière chaque image. La recomposition de textes anciens a permis de fournir aux étudiants des sources typographiquement modernisées qui n’auraient pu être abordées il y a dix ans. S’ils sont certes moins authentiques scientifiquement, ils présentent des atouts pédagogiques réels, surtout en termes d’approche des concepts.

Deux idées-forces :

  • Le dialogue est aujourd’hui plus que nécessaire entre utilisateurs et concepteurs de bibliothèques virtuelles pour que les initiatives de chacun puissent se concilier et ne pas systématiser de fossé entre e-lecteurs et producteurs d’informations.
  • La mutualisation thématique, bibliographique, linguistique ou simplement encyclopédique de la documentation numérique s’inscrit comme le programme de survie de ses contenus.

Notes

1 Tous acteurs… Les documents numérisés en ligne. Cf. Arabesques no 40.

References

Bibliographical reference

Ghislain Dibie and Cécile Martini, « Les documents numérisés en ligne », Arabesques, 41 | 2006, 16-17.

Electronic reference

Ghislain Dibie and Cécile Martini, « Les documents numérisés en ligne », Arabesques [Online], 41 | 2006, Online since 20 mars 2023, connection on 19 juillet 2025. URL : https://publications-prairial.fr/arabesques/index.php?id=3269

Authors

Ghislain Dibie

Pôle universitaire européen Lille-Nord-Pas-de-Calais

Author resources in other databases

  • IDREF
  • ISNI
  • VIAF
  • BNF

By this author

Cécile Martini

Université Lille-III Service commun de la documentation

Author resources in other databases

  • IDREF
  • VIAF

By this author

Copyright

CC BY-ND 2.0