Série : JournaBot (5/6)
L’année 2023, une année déterminante pour l’intelligence artificielle (IA) et son application dans le journalisme ? C’est en tout cas ce que prédisait en janvier dernier l’Institut Reuters pour l’étude du journalisme de l’Université d’Oxford (Royaume-Uni). D’après son enquête menée auprès de 303 professionnels des médias issus de 53 pays, les entreprises médiatiques sont en train d’intégrer discrètement l’IA dans leurs produits : « Près de trois sur dix (28 %) déclarent que cela fait désormais partie intégrante de leurs activités, et 39 % déclarent avoir mené des expériences dans ce domaine ». En Belgique, le groupe de presse Rossel, qui mise depuis quelques années sur le logiciel de génération automatique de textes de la société LabSense, réfléchit activement à la meilleure manière d’intégrer davantage l’IA générative de contenus dans ses rédactions.
Une utilisation croissante de l’IA dans la production d’information
Il y a déjà 4 ans, une étude conduite par un groupe de réflexion de l’École d’économie et de sciences politiques de Londres (Royaume-Uni) auprès de 71 organismes de presse (incluant De Standaard, Mediafin, les éditeurs des journaux L’Echo et De Tijd, et VRT NWS) révélait que deux tiers des répondants utilisaient l’IA dans la production d’information.
En 2020, le journal L’Echo se dotait effectivement du logiciel de création de textes conçu par la société française Syllabs, en vue de produire automatiquement et quotidiennement de courts articles sur l’actualité des marchés boursiers. Ces derniers se basaient sur des données fournies par l’entreprise VWD, active en tant que fournisseur de données financières. L’intérêt ? Automatiser une tâche fastidieuse et répétitive pour les journalistes afin qu’ils se focalisent sur des choses plus intéressantes. La parution de ces articles signés par « Quotebot » (nom donné au robot rédactionnel par la rédaction) est toutefois stoppée début 2021, pour des raisons budgétaires.
Le groupe Rossel – dans lequel on trouve notamment Le Soir, Cinenews, Grenz-Echo, et le Groupe Sudmedia (Sudinfo.be, La Meuse, La Nouvelle Gazette, La Province, Nord Eclair, La Capitale, Ciné Télé Revue, Vlan, 7Dimanche) –, également ancien client de la société Syllabs, a d’ailleurs préféré se tourner en 2019 vers sa concurrente, LabSense, jugée moins chère.
Des milliers d’articles produits chaque week-end
Comme le rapporte André Thiel, spécialiste des Solutions Editoriales au sein du Groupe Rossel, « le logiciel de Labsense nous sert pour le moment à couvrir les compétitions de football de jeunes et d’amateurs. Ce qui représente des milliers de matchs par week-end, et donc des milliers d’articles. Un service qui nous coûte 1000 € par mois. »
La décision de passer par l’IA a été prise lors du renouvellement d’une collaboration entre Rossel et l’Union royale belge des Sociétés de Football-Association (URBSFA). Le groupe souhaitait alors couvrir ces compétitions, qui n’étaient jusque-là pas traitées. « Il était évidemment humainement impossible d’envoyer des journalistes couvrir ces milliers de rencontres. » L’ambition étant, à terme, de se présenter comme « la » référence du sport local en Belgique francophone. « On a d’ailleurs aussi investi à ce moment-là dans les rédactions, afin de renforcer nos équipes qui traitent le sujet », précise André Thiel.
Ces contenus automatisés se retrouvent exclusivement dans la rubrique « sport » du site Sudinfo.be. Les autres titres belges du groupe n’ont, en effet, pas vocation à traiter ce type de sujet, bien qu’il puisse être envisagé de le faire chez Grenz-Echo, « mais ça demanderait de travailler sur un nouveau projet en allemand. Ce n’est pas transposable en état. »
Un succès (encore ?) peu rentable
Concrètement, ces comptes-rendus de matchs sont produits par LabSense sur base des données communiquées par l’Union belge de Football, elles-mêmes fournies à l’Union via une feuille de match digitalisée complétée par l’arbitre. Il est ainsi précisé à la fin de chaque article que ces derniers ont été rédigés « sur base des données officielles de l’URBSFA ».
Afin d’arriver à un résultat optimal d’un point de vue rédactionnel, LabSense et certains membres de la rédaction de Sudinfo ont travaillé de concert sur ce projet pendant plusieurs semaines.
Ecoutez André Thiel revenir sur l’apport des journalistes au projet:
Aujourd’hui, la totalité du travail est effectuée par le logiciel, de l’écriture à la publication sur Sudinfo.be. « L’outil tourne et produit les textes convenus, mais je dirais que c’est surtout un succès d’estime plutôt qu’un succès commercial ou d’audience. Puisque ce sont de petites équipes dans de petits clubs, on n’a pas réussi à « viraliser » ces articles. C’est donc une belle machine, mais qui reste encore à rentabiliser », évalue André Thiel.
L’attrait de l’apprentissage automatique
Le logiciel développé par LabSense se fonde sur la méthode dite « à base de règles » qui, dans le contexte de la génération automatique de textes, offre un bon contrôle (et, a priori, une bonne qualité) des écrits produits. Par ailleurs, en cas d’erreur, le problème peut être facilement identifié et corrigé. Cette méthode présente néanmoins des limites pour générer des contenus dans des domaines plus vastes et diversifiés.
C’est pourquoi Rossel (comme d’autres groupes de presse), s’intéresse de plus en plus aux IA génératives basées sur les méthodes d’apprentissage automatique (machine learning) ou d’apprentissage profond (deep learning), capables de produire des textes de manière originale sur des sujets variés. Il y a quelques mois, un groupe de travail a été constitué pour plancher activement sur le sujet.
Le principal souci de ces IA est qu’elles fournissent un résultat moins prévisible, dans le ton et/ou le style par exemple, et un risque de biais. Celles-ci joueraient donc plutôt un rôle d’assistant auprès des journalistes. Pour Demetrio Scagliola, rédacteur en chef des journaux de Sudmedia, ces technologies seront essentiellement utiles pour décharger les rédacteurs de tâches répétitives. « On découvre actuellement les possibilités offertes par ces IA, et on réfléchit à la manière dont elles pourraient produire des contenus à faible valeur éditoriale. Ce qui permettrait aux journalistes de se concentrer sur l’actualité locale, régionale, l’enquête, etc. »
Le danger de médias 100% automatisés
D’après l’Institut Reuters, l’avènement de ces IA génératives est « susceptible de conduire à une explosion des médias automatisés ou semi-automatisés dans les prochaines années – pour le meilleur comme pour le pire ». Le pire étant la publication d’articles générés par l’IA sans aucune supervision humaine. Ce qui, d’après la start-up américaine NewsGuard, est déjà une réalité.
A l’heure où nous écrivons ces lignes, l’entreprise a déjà recensé 452 sites d’information et d’actualité entièrement ou en partie générés par des outils d’IA sans contrôle humain notable. L’intérêt pour les créateurs de ces sites, dont les interfaces sont généralement de piètre qualité, est d’engranger à bas coût des revenus via la publicité programmatique.
Si des travers existent et, vraisemblablement, se multiplieront à l’avenir, ceux-ci ne constituent pas pour autant une fatalité. Selon Demetrio Scagliola, l’avènement de l’IA ne signe pas la fin du journalisme et, dans le cas de Sudmedia, celui pratiqué en presse régionale.
Ecoutez Demetrio Scagliola en expliquer la raison :
L’IA, un tueur d’emplois ?
Le potentiel de l’IA et les risques qui lui sont associés, seraient-ils surestimés ? Pour Nicolas van Zeebroeck, chercheur et professeur d’économie et stratégie numériques à la Solvay Brussels School of Economics and Management (ULB), il convient de tempérer les craintes concernant le remplacement de l’humain par l’IA : « Je ne suis pas du tout sûr que le tissu économique sera un jour capable de passer à l’automatisation à grande échelle, ou même à l’échelle d’un métier. En tout cas, pas aussi vite qu’on ne l’imagine. »
Les emplois ont plus de chance d’être complétés que substitués par cette technologie. Une hypothèse qui va dans le sens des résultats d’une étude de l’Organisation Internationale du Travail, suggérant que « la plupart des emplois et des industries ne sont que partiellement exposés à l’automatisation et sont davantage susceptibles d’être complétés que remplacés par la dernière vague d’IA générative, telle que ChatGPT. Par conséquent, l’impact le plus important de cette technologie ne sera probablement pas la destruction d’emplois, mais plutôt les changements potentiels de la qualité des emplois, notamment l’intensité du travail et l’autonomie. »
D’après le Pr van Zeebroeck : « l’IA va surtout avoir un impact sur la nature du travail. Au-delà de la question de la destruction du travail humain, je m’inquiète beaucoup plus du fait que les machines en viennent, à l’avenir, à exécuter la partie intéressante d’un emploi : écrire pour un journaliste, poser un diagnostic pour un médecin, voler pour un pilote… et qu’il ne restera plus que le côté « barbant » à l’humain : vérifier le contenu, le diagnostic, le pilote automatique. Le job perdra alors méchamment en intérêt.»
Concernant le gain de temps promis par ces technologies, le chercheur est aussi sceptique : « On va peut-être gagner du temps sur certaines tâches, mais on risque aussi d’en perdre dans le contrôle de la production de l’IA. »
Cette large enquête sur le journalisme automatisé par l’intelligence artificielle a bénéficié du soutien du Fonds pour le journalisme en Fédération Wallonie-Bruxelles.
JournaBot 1/6 : Face aux IA génératives, les journalistes sont plus que jamais essentiels
JournaBot 2/6 : Quand les médias rejoignent le portefeuille client d’entreprises informatiques
JournaBot 3/6 : À l’heure de l’IA, les journalistes doivent jouer leur rôle de certificateurs de l’information
JournaBot 4/6 : Un cadre juridique pour freiner d’urgence la folle accélération de la désinformation
JournaBot 5/6 : La nature du travail journalistique en pleine mutation
JournaBot 6/6: Une avalanche d’outils à découvrir, à maîtriser, et (peut-être) à utiliser