Organisme de radiodiffusion et de télévision flamand

Automatisation de la création de résumés d'actualités de la VRT à l'aide du traitement du langage naturel

Impact

Le modèle piloté par l'IA est un outil puissant qui aide les journalistes dans leur travail de rédaction en accélérant la création du résumé et en suggérant des formulations alternatives. De cette façon, la créativité humaine et l'IA peuvent renforcer leurs forces complémentaires et produire des résultats de haute qualité.

Présentation du client

La VRT est le radiodiffuseur national de service public de la Communauté flamande de Belgique. Avec ses trois chaînes de télévision, ses cinq stations de radio et ses divers canaux numériques, la VRT touche chaque semaine jusqu'à 90 % de la population flamande. Le VRT NWS est le service d'information de la VRT et vise à tenir les Flamands informés de l'actualité nationale et internationale par le biais de ses divers canaux (tels que le site web, l'application et les émissions de télévision en direct). La VRT dispose également d'un département d'innovation qui explore en permanence de nouvelles technologies et applications à des fins médiatiques, en étroite collaboration avec ses utilisateurs finaux.

Défi

Les articles d'actualité sur le site Web de la VRT NWS se composent généralement d'un court résumé suivi de l'intégralité de l'article. Le résumé est une version condensée de l'article et reprend les principaux points de l'histoire. La création de résumés étant un processus répétitif et fastidieux, le service d'innovation de la VRT a étudié la possibilité d'utiliser le traitement du langage naturel pour automatiser cette activité. Deux approches peuvent être utilisées pour cela : le résumé extractif et le résumé abstractif. Le résumé extractif se concentre sur l'identification des parties les plus importantes de l'article et produit un ensemble de phrases à partir du texte original, tandis que la méthode abstractive produit un nouveau texte basé sur l'interprétation de l'article. La VRT a opté pour la méthode abstractive, qui est une méthode plus moderne et qui fournit des résultats plus prometteurs. Ainsi, le département d'innovation a cherché à développer des modèles entraînés pour permettre la création automatique de résumés de nouvelles. Bien qu'ils aient déjà affiné leurs modèles, ils n'étaient pas satisfaits de la qualité du résultat. ML6 a donc fourni des conseils techniques approfondis sur la formation et le déploiement des modèles afin d'obtenir les meilleures performances possibles.

"Travailler avec ML6, c'est investir dans notre propre personnel. Nous pensons qu'il est important d'avoir des connaissances internes, et grâce à notre collaboration, nous avons reçu un transfert de connaissances de manière très efficace, ce qui a amené notre personnel à un niveau de connaissances supérieur. Nous achetons des connaissances, nous achetons de la flexibilité, nous investissons dans notre personnel pour l'avenir."

Ingénieur principal en automatisation des combinaisons

Par

CNHi

Solution

Pour améliorer l'entraînement des modèles et la qualité des résultats finaux, ML6 a proposé une méthode de travail séquentielle : en partant d'un "modèle BART" de NLP multilingue pré-entraîné (voir l'article), puis en effectuant une première phase d'ajustement sur des résumés de nouvelles anglaises traduits en néerlandais, et enfin en intégrant les données de la VRT dans le modèle. Cette façon de compléter les données du client par des données traitées de source ouverte permet d'améliorer la qualité des résumés générés.

Par

Résultats

Ce type de modèle Transformer est un outil puissant pour aider les journalistes dans leur travail de rédaction. Ils peuvent accélérer la création du résumé et suggérer des formulations alternatives. En même temps, ils ne peuvent pas remplacer la perspicacité et la créativité des journalistes, qui sont des compétences humaines acquises à une échelle plus large que les données d'entraînement (limitées) présentées au modèle NLP. Dans cette optique, on peut dire que les humains et l'IA peuvent renforcer leurs forces complémentaires et produire des résultats de haute qualité. Comme test final de cette théorie et afin d'évaluer la qualité de la production de cet outil, un journaliste de la VRT a testé certains des résumés d'informations basés sur des articles existants de la VRT, ce qui a permis à l'innovation de la VRT d'obtenir de nouvelles idées et un retour d'information.