Prédiction automatique de fonctions pragmatiques dans les reformulations

Natalia Grabar; Iris Eshkol-Taravella

Communication Dans Un Congrès Année : 2016

Prédiction automatique de fonctions pragmatiques dans les reformulations

(1) , (2)

1
2

Natalia Grabar

Fonction : Auteur
PersonId : 997371

Savoirs, Textes, Langage (STL) - UMR 8163

Iris Eshkol-Taravella

Fonction : Auteur
PersonId : 18520
IdHAL : iris-eshkol-taravella
ORCID : 0000-0003-0814-3623
IdRef : 074195158

Laboratoire Ligérien de Linguistique

Résumé

Automatic prediction of pragmatic functions in reformulations. Reformulations participate in structuring of discourse, especially in dialogues, and also contributes to the dynamics of the discourse. Reformulation is a significant act which has to satisfy precise objectives. The purpose of our work is to automatically predict the reason for which a speaker performs a reformulation. We use a classification with eleven pragmatic functions inspired by the existing work and by the data analyzed. The reference data are built through manual and consensual annotations of spontaneous reformulations introduced by three markers (c'est-à-dire, je veux dire, disons). The data are provided by spoken corpora and a corpus with forum discussions on health issues. We exploit supervised categorization algorithms and a set with several descriptors (syntactic, formal, semantic and discursive) for the prediction of the reformulation categories. The distribution of utterances and sentences is not homogeneous across categories. The experiments are positioned at two levels : general and specific. Our results indicate that it is easier to predict the types of functions at the general level (the average F-measure is around 0.80), than at the level of individual categories (the average F-measure is around 0.40). We study the influence of various parameters.

La reformulation participe à la structuration du discours, notamment dans le cas des dialogues, et contribue également à la dynamique du discours. Reformuler est un acte significatif qui poursuit des objectifs précis. L'objectif de notre travail est de prédire automatiquement la raison pour laquelle un locuteur effectue une reformulation. Nous utilisons une classification de onze fonctions pragmatiques inspirées des travaux existants et des données analysées. Les données de référence sont issues d'annotations manuelles et consensuelles des reformulations spontanées formées autour de trois marqueurs (c'est-à-dire, je veux dire, disons). Les données proviennent d'un corpus oral et d'un corpus de discussions sur les forums de santé. Nous exploitons des algorithmes de catégorisation supervisée et un ensemble de plusieurs descripteurs (syntaxiques, formels, sémantiques et discursifs) pour prédire les catégories de reformulation. La distribution des énoncés et phrases selon les catégories n'est pas homogène. Les expériences sont positionnées à deux niveaux : générique et spécifique. Nos résultats indiquent qu'il est plus facile de prédire les types de fonctions au niveau générique (la moyenne des F-mesures est autour de 0,80), qu'au niveau des catégories individuelles (la moyenne des F-mesures est autour de 0,40). L'influence de différents paramètres est étudiée.

Mots clés

Reformulation machine learning paraphrase classification pragmatic function

Domaines

Traitement du texte et du document Linguistique

Fichier principal

grabar-TALN2016.pdf (181.79 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Natalia Grabar : Connectez-vous pour contacter le contributeur

https://hal.science/hal-01426814

Soumis le : mercredi 4 janvier 2017-22:40:17

Dernière modification le : vendredi 16 février 2024-18:30:04

Archivage à long terme le : mercredi 5 avril 2017-15:28:28

Dates et versions

hal-01426814 , version 1 (04-01-2017)

Identifiants

HAL Id : hal-01426814 , version 1

Citer

Natalia Grabar, Iris Eshkol-Taravella. Prédiction automatique de fonctions pragmatiques dans les reformulations. TALN 2016: Traitement Automatique des Langues Naturelles, Jun 2016, Paris, France. ⟨hal-01426814⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

BNF UNIV-TOURS CNRS UNIV-ORLEANS STL LLL CAMPUS-AAR AAI UNIV-LILLE

156 Consultations

233 Téléchargements

Prédiction automatique de fonctions pragmatiques dans les reformulations

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager