Génération automatique de billets journalistiques : singularité et normalité d'une sélection

Résumé : La génération automatique de billets journalistiques est utilisée pour transcrire en texte des informations répondant à une requête utilisateur : pré- visions météo, résultats d’élections, sportifs ou boursiers... En général, le texte généré se contente de décrire les données pertinentes sans souligner leurs sin- gularités ou normalité par rapport à un sur-ensemble. Or, la plupart du temps, les connaissances disponibles permettent de souligner ce type d’informations. En effet, les données décrivent une même information à différents instants ou pour différents groupes. Il est donc envisageable de détecter automatiquement le caractère exceptionnel d’un prix ou d’une défaite électorale. Cet article pré- sente une démarche et un outil permettant de spécifier un générateur de texte comparant une sélection de données à l’ensemble des données disponibles. Les singularités et les régularités exprimables à partir d’une sélection de données sont illustrées à travers un exemple (résultats d’élections). L’explicitation des connaissances (modèles, ressources langagières,...) nécessaires à la construction du générateur de textes a pour objectif de rendre l’approche générique et appli- cable à différents domaines (météo, élections, sports,...). Le prototype Summy a été réalisé pour valider la faisabilité de l’approche en utilisant les données des élections régionales. Ce prototype permet notamment de montrer comment au- tomatiquement exprimer en langage naturel la singularité ou la normalité d’un sous-ensemble de données par rapport à l’ensemble.
Type de document :
Communication dans un congrès
Extraction et Gestion des Connaissances (EGC) 2017 Atelier Journalisme Computationnel,, Jan 2017, Grenoble, France. Revue des Nouvelles Technologies de l'Information EGC 2017, 2017
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-01491520
Contributeur : Cyril Labbé <>
Soumis le : vendredi 17 mars 2017 - 08:47:20
Dernière modification le : jeudi 11 octobre 2018 - 08:48:04
Document(s) archivé(s) le : dimanche 18 juin 2017 - 12:20:17

Fichier

summy_ws.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01491520, version 1

Citation

Jérémy Vizzini, Cyril Labbé, François Portet. Génération automatique de billets journalistiques : singularité et normalité d'une sélection. Extraction et Gestion des Connaissances (EGC) 2017 Atelier Journalisme Computationnel,, Jan 2017, Grenoble, France. Revue des Nouvelles Technologies de l'Information EGC 2017, 2017. 〈hal-01491520〉

Partager

Métriques

Consultations de la notice

234

Téléchargements de fichiers

119