Génération automatique de billets journalistiques : singularité et normalité d'une sélection

Jérémy Vizzini; Cyril Labbé; François Portet

Communication Dans Un Congrès Année : 2017

Génération automatique de billets journalistiques : singularité et normalité d'une sélection

(1) , (1) , (2, 3)

1
2
3

Jérémy Vizzini

Fonction : Auteur

Systèmes d’Information - inGénierie et Modélisation Adaptables

Cyril Labbé

Fonction : Auteur
PersonId : 9675
IdHAL : cyril-labbe

Systèmes d’Information - inGénierie et Modélisation Adaptables

François Portet

Fonction : Auteur
PersonId : 1069
IdHAL : francois-portet
ORCID : 0000-0003-2542-0661
IdRef : 098179160

Laboratoire d'Informatique de Grenoble

Groupe d’Étude en Traduction Automatique/Traitement Automatisé des Langues et de la Parole

Résumé

Natural language generation is used to describe, in natural language, the data answering a user query : weather forecast, elections or sport results... In most cases, the generated text do not show the singularity nor the normality of the selected data compared to the whole. Most of the time, the knowledge needed to express these particular kind of information is available. It is thus possible to detect particular exceptional or banal features of a selection and to generate automatically a text that exposes these interresting facts. This paper presents a tool aiming at specifying generators of texts containing comparisons of the selected data to the whole set. Singularity and banality exprimable using the tool are showed thanks to an example (election results). Reification of the needed knowledge (models, language ressources,... ) aims for genericity of the approche and easy reuse for other domains (weather forecast, sports,...). The prototype Summy was built to validate the approach and to demonstrate how particularity or normality of a subset of data compared to the whole can be automatically expressed.

La génération automatique de billets journalistiques est utilisée pour transcrire en texte des informations répondant à une requête utilisateur : pré- visions météo, résultats d’élections, sportifs ou boursiers... En général, le texte généré se contente de décrire les données pertinentes sans souligner leurs sin- gularités ou normalité par rapport à un sur-ensemble. Or, la plupart du temps, les connaissances disponibles permettent de souligner ce type d’informations. En effet, les données décrivent une même information à différents instants ou pour différents groupes. Il est donc envisageable de détecter automatiquement le caractère exceptionnel d’un prix ou d’une défaite électorale. Cet article pré- sente une démarche et un outil permettant de spécifier un générateur de texte comparant une sélection de données à l’ensemble des données disponibles. Les singularités et les régularités exprimables à partir d’une sélection de données sont illustrées à travers un exemple (résultats d’élections). L’explicitation des connaissances (modèles, ressources langagières,...) nécessaires à la construction du générateur de textes a pour objectif de rendre l’approche générique et appli- cable à différents domaines (météo, élections, sports,...). Le prototype Summy a été réalisé pour valider la faisabilité de l’approche en utilisant les données des élections régionales. Ce prototype permet notamment de montrer comment au- tomatiquement exprimer en langage naturel la singularité ou la normalité d’un sous-ensemble de données par rapport à l’ensemble.

Domaines

Informatique [cs]

Fichier principal

summy_ws.pdf (423.09 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Cyril Labbé : Connectez-vous pour contacter le contributeur

https://hal.science/hal-01491520

Soumis le : vendredi 17 mars 2017-08:47:20

Dernière modification le : jeudi 4 avril 2024-21:27:48

Archivage à long terme le : dimanche 18 juin 2017-12:20:17

Dates et versions

hal-01491520 , version 1 (17-03-2017)

Identifiants

HAL Id : hal-01491520 , version 1

Citer

Jérémy Vizzini, Cyril Labbé, François Portet. Génération automatique de billets journalistiques : singularité et normalité d'une sélection. Extraction et Gestion des Connaissances (EGC) 2017 Atelier Journalisme Computationnel,, Jan 2017, Grenoble, France. ⟨hal-01491520⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UGA CNRS LIG LIG_GLSI_SIGMA LIG_TDCGE_GETALP LIG_SIDCH

186 Consultations

204 Téléchargements

Génération automatique de billets journalistiques : singularité et normalité d'une sélection

Résumé

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager