Présentation des dernières avancées et des nouveautés du projet
Le projet Istex1, engagé depuis 2013 dans une politique nationale d’acquisition massive d’archives de la littérature scientifique dans toutes les disciplines, a pour objectif l’agrégation de ces ressources en une unique collection au sein d’une plateforme nationale, ainsi que la création de services apportant une plus-value basée sur le traitement des données en texte intégral.
16,5 millions d’objets documentaires intégrés
Une des principales nouveautés de la plateforme Istex est le nombre de ressources disponibles. Actuellement, plus de 16,7 millions d’objets documentaires (articles et chapitres de monographie) sont disponibles à travers les services opérés par l’Inist-CNRS.
De nouvelles fonctionnalités sur la plateforme
Plusieurs fonctionnalités ont été ajoutées récemment à la plateforme Istex. La première d’entre elles est le filtrage des résultats à l’aide de facettes. Ce mécanisme permet d’affiner une recherche sur la quasi-totalité des métadonnées. Il est également possible de trier les résultats d’une recherche selon le champ de son choix. Les tris numériques, alphanumériques et chronologiques sont supportés selon la nature du champ sélectionné. Enfin, on notera que l’interface de programmation (API) Istex2 s’est dotée d’un résolveur de requêtes compatible avec la norme OpenURL 1.03. Cette fonctionnalité permet aux ayants droit d’accéder de manière simple et standardisée aux ressources. Cette dernière avancée permet aussi aux ressources Istex d’être accessibles via des outils de type résolveurs de lien.
Des ressources enrichies
Concernant l’enrichissement des ressources acquises, un ensemble de 7,4 millions d’articles a été catégorisé suivant le plan de classement du Web of Science4. Un second chantier a permis d’automatiser la localisation, l’identification, la restructuration et le codage des références bibliographiques citées dans le plein texte. Cette procédure a été appliquée sur l’ensemble des ressources ne possédant pas nativement de codage spécifique des références.
Une intégration facilitée dans les outils documentaires des établissements
Suite aux premières expérimentations menées dans le cadre du Projet Istex - Services Numériques des Usagers (SNU), la plateforme est accessible en bêta-test dans certains établissements de l’Enseignement supérieur5. La plateforme Istex n’est pas un portail supplémentaire : elle s’intègre aux outils déjà existants, Environnements Numériques de Travail (ENT) ou Discovery Tools (DT) des établissements6, et facilite ainsi le travail de recherche des utilisateurs. Les établissements qui n’ont pas encore intégré le projet Istex-SNU et souhaitent devenir bêta-testeurs peuvent prendre contact avec le responsable du projet Istex-SNU à l’Université de Lorraine (Julien Marchal, julien.marchal@univ-lorraine.fr).
Des chantiers d’usage diversifiés
Enfin, en plus des services à valeur ajoutée en cours de développement dans le cadre du projet, le comité exécutif d’Istex a lancé un appel à propositions : « chantiers d’usage ». Au-delà de simples informations bibliographiques, ceux-ci utilisent les corpus plein texte Istex comme des données de base de recherches de type « fouille de texte » ou text mining. Au terme du processus de sélection, 8 projets ont été retenus. Ils couvrent des thématiques diversifiées allant de l’analyse multidimensionnelle de corpus à l’identification et l’analyse de terrains d’études, en passant par l’aide à l’exploration d’un domaine pour un néophyte au travers de l’exploitation de grands fonds textuels ou la mise en place de surligneurs sémantiques automatiques de textes scientifiques.
Ainsi le projet avance et offre dès aujourd’hui à la communauté scientifique des services nouveaux tant en matière d’accès à des collections rétrospectives de littérature scientifique qu’en matière d’exploitation de ces fonds pour des recherches de text mining.