PERSÉE est un programme de numérisation et de publication électronique de revues scientifiques en sciences humaines et sociales de langue française initié par le ministère de l’éducation nationale, de l’enseignement supérieur et de la recherche, et réalisé par des établissements publics. http://www.persee.fr
La direction de l’enseignement supérieur, dans le cadre de sa mission de définition et de mise en œuvre d’une politique de développement et de valorisation de l’information scientifique et technique, a lancé en mars 2003 un appel d’offres pour sélectionner un établissement public qui prendrait en charge la réalisation et la gestion d’un portail de diffusion de revues scientifiques en SHS – sciences humaines et sociales. La numérisation et la mise en ligne d’un tel corpus répondent à un triple objectif de valorisation des publications scientifiques en langue française, de promotion de l’accès libre aux résultats de la recherche et au patrimoine scientifique et de mise à disposition de la communauté scientifique d’un outil de recherche et de consultation. Le projet présenté par le consortium d’établissements regroupant l’Université Lumière, la Maison de l’Orient et de la Méditerranée et l’Université de Nice-Sophia Antipolis, a été retenu1. Cette sélection a inauguré une période de 14 mois de développements et le traitement de sept revues « pionnières ». L’une des ambitions de PERSÉE, au-delà de la numérisation des collections imprimées de revues scientifiques et de leur diffusion en ligne, est d’offrir des services et des outils permettant une exploitation riche des documents sans que l’internaute ne perçoive de rupture notable avec ce qui lui est proposé pour l’édition courante. Ce souhait d’assurer une qualité de consultation et de services comparable à celle existant pour les portails d’édition courante s’accompagne d’une volonté de garantir l’interopérabilité avec les autres projets du même type et de mettre en œuvre des solutions technologiques capables de supporter des évolutions à venir. La première phase de conception et de réalisation s’est achevée en janvier 2005 avec l’ouverture au public du portail PERSÉE et le début d’une nouvelle phase d’enrichissement du contenu diffusé des fonctionnalités d’utilisation du corpus numérisé.
Fac-similé d’un article faisant apparaître les termes recherchés
Cf. Revue L’Homme, Éditions de l’EHESS-Portail Persée www.persee.fr/
Un accès ouvert à l’information scientifique
Le portail PERSÉE a été conçu en conformité avec les attentes des chercheurs français. Il offre un accès libre et gratuit à l’ensemble des collections numérisées dans une logique de diffusion non exclusive et dans le respect du droit des auteurs dont l’accord est individuellement requis.
L’éditeur ou le diffuseur de la revue peut déterminer une période d’une durée maximale de cinq années pendant laquelle les numéros ne sont pas librement diffusés sur l’internet. Cette période de non diffusion est un moyen de garantir la commercialisation des numéros les plus récents et de préserver l’équilibre économique des revues.
Technologies libres et respect des normes et des standards
Dans une même logique d’ouverture, les solutions technologiques retenues reposent sur des normes et des standards ouverts. En 2006, le résultat des développements informatiques effectués sera disponible et documenté, sous licence open source.
PERSÉE repose sur un certain nombre de normes et de standards qui garantissent une utilisation optimale du site web par tout internaute, l’interopérabilité du portail et des possibilités étendues de mutualisation avec d’autres outils du même domaine :
- XML constitue le pivot du programme PERSÉE ;
- les recommandations du W3C sont respectées ;
- les bibliothèques peuvent intégrer à leur catalogue des références bibliographiques de PERSÉE grâce à la norme Z39.50 ;
- enfin, le portail PERSÉE peut être « moissonné » par toute organisation respectant le protocole OAI PMH.
D’un point de vue documentaire, le schéma METS2, les formats bibliographiques MARC3 et MODS4 et le jeu de métadonnées DC5 et le schéma Érudit article ont été retenus pour décrire les différents niveaux de granularité des revues que sont la collection, le numéro et l’article. La collection de chaque revue est une entité décrite et présentée en tant que telle ; elle englobe des numéros ayant une cohérence éditoriale propre et comprenant des unités documentaires – éditorial, article, compte rendu, note critique. L’article identifié, décrit et pouvant être structuré et finement documenté, constitue l’unité documentaire de base du portail PERSÉE.
Un outil pour les chercheurs
En rupture avec une vision muséographique de la mise en ligne de corpus patrimoniaux, PERSÉE offre un ensemble d’outils d’exploitation et de réappropriation des contenus numérisés qui permet de pallier la contrainte initiale imposée par le support imprimé et la numérisation en mode image. Sur le portail PERSÉE, les utilisateurs disposent d’outils leur permettant de naviguer dans les collections de revues, d’accéder au sommaire et à la table des matières numériques de tous les numéros, d’accéder au fac-similé de la revue, de rechercher un item particulier, d’utiliser le mode texte à des fins de citation et d’obtenir des références bibliographiques précises (titre, auteur, année, volume, numéro, pagination, type d’unité documentaire et conditions d’accès au texte intégral). L’outil de recherche permet d’effectuer des requêtes plus ou moins complexes, sur le texte intégral du corpus (issu d’un logiciel de reconnaissance optique de caractères) ou sur les métadonnées qui sont associées à la collection d’une revue, à un numéro et enfin à un article. Tous les utilisateurs ont la possibilité de télécharger, en format PDF, sur leur poste de travail les documents qui les intéressent et de les imprimer.
Le terme « portail » est usité dans la mesure où PERSÉE fédère l’accès à un bouquet de revues qui ont fait l’objet d’une sélection et répondent à un certain nombre critères de nature éditoriale et scientifique. PERSÉE est doté d’un comité de suivi, présidé par le représentant du Ministère de l’éducation nationale, de l’enseignement supérieur et de la recherche. Il est composé, à parité, de membres de trois collèges rassemblant des représentants des institutions et des établissements publics associés à la réalisation et au développement de PERSÉE, des scientifiques, des directeurs de publications en sciences humaines et sociales et des éditeurs, et des experts choisis pour leurs compétences scientifiques, techniques ou juridiques sur les problématiques de diffusion et de publication électroniques de revues. Ce comité de suivi a entre autres pour missions de veiller au respect des orientations scientifiques de PERSÉE et de se prononcer sur les demandes de partenariat émanant de revues, d’éditeurs et de diffuseurs. Outre l’offre d’un accès fédéré et de fonctionnalités de navigation et de recherche dans les corpus de revues, PERSÉE est un portail car il offre des services spécifiques destinés à des utilisateurs qui ont choisi de s’authentifier. Les utilisateurs authentifiés bénéficient d’outils permettant de sauvegarder d’une session à l’autre les requêtes qui ont pu être lancées et les documents consultés et d’être alertés par courrier électronique de la diffusion via PERSÉE de nouveaux documents correspondant à leurs centres d’intérêt. Enfin, des outils comme les forums permettent d’initier des communautés de lecteurs et de lecture…
Une logique de collaboration et un impératif de diffusion
Le modèle PERSÉE se distingue d’une simple prestation de service reposant sur une externalisation de toutes les tâches de la rédaction de la revue vers l’équipe PERSÉE. Il repose sur un principe fondamental de coopération et d’échange, les parties prenantes intervenant en fonction de leurs compétences respectives. Les revues, acteur essentiel du programme, décident de la description intellectuelle de la publication, participent à la production des données et les valident avant leur mise en ligne. Elles prennent également en charge les demandes d’autorisation de diffusion adressées à leurs auteurs ; quant à l’équipe PERSÉE, elle assure l’expertise technique, la numérisation et la publication électronique des collections imprimées. Des accords de coopération sont en cours avec les principaux portails francophones assurant la diffusion de la production courante de revues scientifiques en sciences humaines et sociales – revues.org, CENS6, CAIRN, Armand Colin. L’objectif est d’offrir aux lecteurs une continuité dans la consultation des fonds lorsque la partie patrimoniale de la revue est disponible sur PERSÉE et que la partie courante est accessible sur un autre site en utilisant le protocole OAI.
Actuellement, les internautes peuvent accéder sur PERSÉE à plus de 25 000 documents, dont 8 200 articles scientifiques. L’objectif est de multiplier les points d’accès afin d’assurer la plus grande diffusion de cette information scientifique sur le réseau. L’indexation par les moteurs de recherche de type Google Scholar est une première étape qui sera complétée, en 2006, par des liens avec les bases de données bibliographiques d’éditeurs privés. La conformité au protocole OAI-PMH constitue le meilleur vecteur de diffusion avec la propagation des métadonnées. PERSÉE est notamment « moissonné » par le portail du Sudoc (Système universitaire de documentation) et par OAIster7 qui « moissonne » plus de 400 archives à travers le monde.
Cf. www.persee.fr
Les partenaires
Le Ministère de l’éducation nationale, de l‘enseignement supérieur et de la recherche (MENESR), à travers la direction de l‘enseignement supérieur en concertation avec la direction de la recherche et la direction de la technologie, finance et coordonne le projet ; il assure le suivi du développement du portail.
PERSÉE est doté d’un comité de suivi, présidé par le représentant du MENESR. Il est composé, à parité, de membres de trois collèges.
Le consortium d’établissements regroupe l’Université Lumière, la Maison de l’Orient et de la Méditerranée et l’Université de Nice- Sophia Antipolis ; conduit par Lyon-II, il assure les développements technologiques liés à la plate-forme de production et au portail de diffusion, la gestion des outils développés, la numérisation des collections et l’organisation du traitement des revues en concertation avec ces dernières.
Le CINES – Centre informatique national de l’enseignement supérieur – assure la diffusion et l’archivage pérenne des collections.