La veille à l’heure des big data et de l’intelligence artificielle

DOI : 10.35562/arabesques.94

p. 4-5

Plan

Texte

La veille documentaire et la veille informationnelle sont largement pratiquées en bibliothèque, avec une évolution marquée vers la veille collaborative en réseau.

Alors qu’on se prépare à fêter le trentième anniversaire du web1 et que les « GAFAM »2 investissent des moyens importants dans l’intelligence artificielle, comment les pratiques de veille évoluent-elles aujourd’hui, dans un paysage informationnel très mouvant ? Le cycle classique de la veille est basé sur l’enchaînement itératif de quatre étapes : définition des besoins et des axes de veille, collecte de l’information, traitement ou analyse des contenus, et enfin diffusion sous forme de livrables. À l’heure de la surabondance d’information, de l’analyse automatisée et des usages collaboratifs, ce modèle classique se transforme et intègre de nouvelles méthodes, sources et solutions innovantes.

La veille documentaire ou stratégique, une pratique ancienne

La pratique de veille documentaire ou stratégique est loin d’être nouvelle pour les professionnels de l’information, quelle que soit leur expertise. Depuis une quarantaine d’années, les méthodes, outils et sources de veille ont évolué conjointement avec les pratiques et les usages. Dans les années 1960-1970, la prolifération de la littérature scientifique et technique (articles, brevets, thèses) et l’apparition des premières bases de données informatisées accompagnent l’essor de la veille technologique. Les services d’information financière (accessibles à l’époque via la télématique), ainsi que les systèmes de business intelligence apparus dans les années 1980 correspondent au développement de la veille concurrentielle.

Les années 1990 sont marquées par les débuts du web et par la formalisation du concept d’intelligence économique, qui regroupe les différents types de veille, mais aussi la gestion d’influence et la protection du patrimoine informationnel. Une nouvelle vague arrive dans les années 2000, avec l’avènement du « web 2.0 », des réseaux sociaux et de la veille e-reputation. Plus récemment, le web des années 2010, de plus en plus orienté vers le mobile, le multimédia, et parfois l’éphémère, introduit de nouvelles mutations dans les pratiques d’une veille toujours plus en prise avec le temps réel et le collaboratif.

 

 

Crédit photo Amanda Dalbjorn - Unsplash

Dans le monde des bibliothèques, la veille concerne en premier lieu la surveillance des publications et parutions ; cette veille éditoriale peut s’accompagner d’une veille « informationnelle », qui consiste en un suivi systématique des informations sur un sujet donné, lié ou connexe au métier de base. De ce fait, la veille en bibliothèque est indissociable de la politique documentaire et du plan de développe- ment des collections. Il s’agit de suivre les parutions d’ouvrages ou d’articles, imprimés ou numériques, mais aussi de repérer de nouveaux auteurs phares, ou des thématiques émergentes. La veille permet également de détecter d’éventuelles lacunes dans la politique documentaire. Le processus de veille peut s’accompagner d’une dimension d’analyse stratégique de l’information destinée à favoriser l’anticipation et la prise de décision.

La notion de veille stratégique se décline ainsi selon plusieurs facettes : technologique, concurrentielle, e-reputation... La veille s’apparente davantage à un art qu’à une science exacte, et il existe de nombreuses approches. On peut distinguer une approche « ciblée » et une approche « radar ». Dans le premier cas, il s’agit du suivi systématique d’un sujet ou d’un thème connu (actualité d’un domaine, parutions d’un chercheur, brevets déposés dans un secteur donné…). La veille « ciblée » s’effectue notamment à partir de la surveillance régulière d’un bouquet de sources identifiées préalablement. La deuxième approche, qualifiée de « radar », s’attache davantage à la découverte des innovations et des tendances, dans une logique exploratoire. Dans ce cas de figure, seront plus particulièrement en œuvre des alertes établies à partir de mots clés pertinents.

Solutions de veille : pas d’outil miracle !

Dresser un panorama complet des solutions techniques dans le domaine de la veille est une tâche délicate en raison du caractère polysémique du mot « veille ». Au sens large, ce mot recouvre en effet à la fois la recherche approfondie, la collecte automatisée, l’analyse prédictive, l’identification des tendances et signaux faibles…

Les solutions de veille vont ainsi répondre à tout ou partie de ces besoins. Les outils de « mind mapping » permettent, dans la phase amont, d’organiser sous forme d’arborescence les différents axes de veille ; en aval, on peut les utiliser pour présenter de façon très synthétique les résultats de la veille. Les moteurs de recherche web généralistes (Google, Bing, Qwant) servent à identifier, dans la phase de « sourcing », des sources pertinentes par rapport aux sujets de veille, pour y effectuer ensuite des recherches approfondies ou de la collecte automatisée. Le sourcing peut également passer par l’usage de plateformes de bookmarking social (Diigo) ou de curation de contenus (Scoop it, racheté récemment par Linkfluence, spécialiste de l’analyse du web social).

Les formats de syndication (RSS, Atom et désormais Json feed) restent fondamentaux pour la veille, même si aujourd’hui les flux sont parfois difficiles à détecter sur certains sites. De nouveaux agrégateurs de flux comme Inoreader, très prisé dans la communauté des veilleurs, sont venus compléter les solutions désormais classiques comme Netvibes ou Feedly. Les veilleurs disposent de nombreux outils pour détecter des flux « cachés » (extensions FirefoxAwesome RSS ou Chrome Abonnement RSS) ou convertir une page HTML en flux (Feedity, Feed43). On peut également générer des flux à partir de requêtes récurrentes dans des bases de données, ou activer des services d’alertes (Google Alertes). La surveillance des réseaux sociaux met en œuvre des outils gratuits comme Tweetdeck pour twitter, ou des solutions plus ambitieuses d’écoute des médias sociaux comme Radarly (Linkfluence), Brandwatch ou Synthesio, racheté récemment par Ipsos. Les plateformes de veille classiques effectuent toute la chaine de la veille : collecte, recherche, sourcing, analyse, diffusion. Parmi les plus utilisées, citons Digimind, Ami Enterprise intelligence, Qwam, Kbcrawl, ou Sindup.

Il est désormais difficile d’envisager de mettre en place une veille sans le moindre budget, car les solutions de veille gratuites sont de plus en plus limitées en fonctionnalités. De plus, certaines solutions gratuites ne sont pas toujours pérennes, et risquent d’être rachetées ou de disparaître. L’accès aux sources peut également se révéler onéreux, malgré le développement de l’open access et de l’open data.

Quelles sources pour la veille ?

Face à l’immensité des documents et données disponibles, de nombreux types de veille nécessitent une approche davantage « smart » que « big » data. La veille éditoriale privilégie bien sûr les outils bibliographiques, ainsi que les sites d’éditeurs, leurs newsletters ou leur présence sur le web social. La veille informationnelle peut s’appuyer également sur des sites ou portails pertinents liés à l’actualité, ainsi que sur certains blogs ou sites à caractère anticipatif et prospectif. Les bases de données accessibles en ligne sont des ressources incontournables, mais souvent – malheureusement – sous-utilisées par les professionnels de la veille. Pourtant, on peut générer des flux à partir de requêtes via de nombreuses bases de données d’articles de revues scientifiques, de documents juridiques, de brevets, ou tout simplement de presse quotidienne.

Parmi les réseaux sociaux, on privilégiera les réseaux professionnels (Linkedin), académiques (Researchgate, Academia) ou twitter, en étant bien entendu sélectif sur les profils ou les hasthags à suivre. Car le sourcing, y compris en dehors des réseaux sociaux, ne peut viser l’exhaustivité à l’heure de la surabondance d’information. Au contraire, l’éventail des sources choisies pour la veille doit jouer avant tout la représentativité et la variété, afin d’éviter des formes de « pensée unique » ou des risques de redondance dans les résultats. Un plan de veille rigoureux, basé sur des sources « de première main » choisies pour leur pertinence, leur variété et leur complémentarité, permet de se prémunir contre ces risques éventuels, même s’il n’est pas toujours simple de trouver l’équilibre dans le choix des sources, ce qui consiste à éviter le bruit en laissant place à la sérendipité.

Au-delà de l’expertise concernant les sources et les outils, les veilleurs professionnels ont également un rôle important à jouer dans l’analyse des résultats de la veille, qui peut passer par des solutions de datavisualisation comme Gephi ou encore Visibrain, mais aussi par des outils de text mining qui permettent de mettre en évidence tendances, corrélations et « signaux faibles », à partir de méthodes statistiques et/ou sémantiques. La valeur ajoutée du veilleur consiste non seulement à maîtriser les outils, mais aussi à interpréter judicieusement, et de manière non biaisée, les résultats de la veille.

Vers la veille collaborative

Le cycle classique de la veille mentionné plus haut est aujourd’hui remis en question par certains experts, car jugé trop linéaire et ne tenant pas suffisamment compte d’une organisation collaborative. À l’heure où les solutions collaboratives se multiplient, où le travail en réseau se généralise, la veille ne peut que suivre ce vaste mouvement. Le rôle transversal des veilleurs s’illustre ici à travers des fonctions d’organisation d’un réseau, de mise en place de pratiques harmonisées, ou encore d’animation du dispositif. Entre personnalisation et collaboratif, entre durabilité et évolutivité, entre signal faible et big data, les pratiques de veille se transforment ainsi au rythme des évolutions du web et des usages professionnels. Indissociable de l’innovation et la créativité, la veille est autant une pratique professionnelle qu’un état d’esprit d’ouverture et de curiosité.

Notes

1 Inventé au CERN, en 1989, par Tim Berners-Lee. Retour au texte

2 Acronyme pour : Google, Amazon, Facebook, Apple, Microsoft. Retour au texte

Illustrations

Citer cet article

Référence papier

Véronique Mesguich, « La veille à l’heure des big data et de l’intelligence artificielle », Arabesques, 92 | 2019, 4-5.

Référence électronique

Véronique Mesguich, « La veille à l’heure des big data et de l’intelligence artificielle », Arabesques [En ligne], 92 | 2019, mis en ligne le 06 janvier 2020, consulté le 19 juillet 2025. URL : https://publications-prairial.fr/arabesques/index.php?id=94

Auteur

Véronique Mesguich

Auteur de Rechercher l’information sur le web paru chez DeBoeck en 2018.

Autres ressources du même auteur

  • IDREF

Droits d'auteur

CC BY-ND 2.0