Génération automatique de billets journalistiques : singularité et normalité d'une sélection - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2017

Génération automatique de billets journalistiques : singularité et normalité d'une sélection

Résumé

Natural language generation is used to describe, in natural language, the data answering a user query : weather forecast, elections or sport results... In most cases, the generated text do not show the singularity nor the normality of the selected data compared to the whole. Most of the time, the knowledge needed to express these particular kind of information is available. It is thus possible to detect particular exceptional or banal features of a selection and to generate automatically a text that exposes these interresting facts. This paper presents a tool aiming at specifying generators of texts containing comparisons of the selected data to the whole set. Singularity and banality exprimable using the tool are showed thanks to an example (election results). Reification of the needed knowledge (models, language ressources,... ) aims for genericity of the approche and easy reuse for other domains (weather forecast, sports,...). The prototype Summy was built to validate the approach and to demonstrate how particularity or normality of a subset of data compared to the whole can be automatically expressed.
La génération automatique de billets journalistiques est utilisée pour transcrire en texte des informations répondant à une requête utilisateur : pré- visions météo, résultats d’élections, sportifs ou boursiers... En général, le texte généré se contente de décrire les données pertinentes sans souligner leurs sin- gularités ou normalité par rapport à un sur-ensemble. Or, la plupart du temps, les connaissances disponibles permettent de souligner ce type d’informations. En effet, les données décrivent une même information à différents instants ou pour différents groupes. Il est donc envisageable de détecter automatiquement le caractère exceptionnel d’un prix ou d’une défaite électorale. Cet article pré- sente une démarche et un outil permettant de spécifier un générateur de texte comparant une sélection de données à l’ensemble des données disponibles. Les singularités et les régularités exprimables à partir d’une sélection de données sont illustrées à travers un exemple (résultats d’élections). L’explicitation des connaissances (modèles, ressources langagières,...) nécessaires à la construction du générateur de textes a pour objectif de rendre l’approche générique et appli- cable à différents domaines (météo, élections, sports,...). Le prototype Summy a été réalisé pour valider la faisabilité de l’approche en utilisant les données des élections régionales. Ce prototype permet notamment de montrer comment au- tomatiquement exprimer en langage naturel la singularité ou la normalité d’un sous-ensemble de données par rapport à l’ensemble.
Fichier principal
Vignette du fichier
summy_ws.pdf (423.09 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-01491520 , version 1 (17-03-2017)

Identifiants

  • HAL Id : hal-01491520 , version 1

Citer

Jérémy Vizzini, Cyril Labbé, François Portet. Génération automatique de billets journalistiques : singularité et normalité d'une sélection. Extraction et Gestion des Connaissances (EGC) 2017 Atelier Journalisme Computationnel,, Jan 2017, Grenoble, France. ⟨hal-01491520⟩
186 Consultations
204 Téléchargements

Partager

Gmail Facebook X LinkedIn More