Implication textuelle : problèmes et méthodes pour le TAL - Archive ouverte HAL Accéder directement au contenu
Article Dans Une Revue Langages Année : 2018

Textual Entailment: issues and methods for NLP

Implication textuelle : problèmes et méthodes pour le TAL

Résumé

La reformulation occupe une place importante dans la langue et intervient dans différents contextes de communication où les locuteurs effectuent des reformula- tions pour mieux se faire comprendre par leurs interlocuteurs. Les appli- cations automatiques de TAL (Traitement Automatique des Langues) nécessitent souvent de détecter des énoncés de sens proche, et donc de détecter des reformulations. Ce travail s’inscrit dans ce domaine. Il s’intéresse aux reformula- tions réalisées dans les énoncés émis par des locuteurs différents et n’apparais- sant pas au sein du même discours. En effet, ce type de reformulation est au cœur de nombreuses tâches telles que la recherche de réponses à des questions dans des textes, la simplification de texte, le résumé automatique multi-documents, la traduction, etc. Le problème com- mun posé par ces tâches est de déterminer si l’énoncé ou le fragment de texte A est une reformulation de l’énoncé ou du fragment de texte B : le texte contenant la réponse reformule la question et la complète ; la phrase simplifiée est une reformulation de la phrase initiale ; la traduction est une reformulation dans une autre langue ; un résumé reformule un texte plus long, etc. Selon les cas, les deux énoncés Ravaillac a tué Henri IV et Henri IV a été assassiné par Ravaillac seront en relation de paraphrase ou en relation de dérivation où le sens de l’énoncé- source peut être considéré comme plus général, plus spécifique et peut permettre de déduire une nouvelle information selon l’hypothèse que l’on veut vérifier (Ligozat 2016). Ce problème est défini en TAL comme un problème de reconnais- sance d’inférence textuelle. Établir cette relation entre deux énoncés repose sur la comparaison de leur forme de surface et, surtout, de leur sens. Cette reconnaisance repose sur plusieurs étapes nécessaires, décrites dans cet article : – définir une taxonomie des inférences reposant sur les procédés linguistiques qui les produisent ; – proposer une méthode pour les modéliser et les calculer automatiquement ; – définir un cadre expérimental afin d’évaluer la capacité des machines à les traiter.
Fichier non déposé

Dates et versions

hal-02284463 , version 1 (11-09-2019)

Identifiants

  • HAL Id : hal-02284463 , version 1

Citer

Brigitte Grau, Martin Gleize. Implication textuelle : problèmes et méthodes pour le TAL. Langages, 2018, 4 (212), pp.105-122. ⟨hal-02284463⟩
77 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More