Analyse et expansion des textes en question-réponse - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2004

Analyse et expansion des textes en question-réponse

Bernard Jacquemin

Résumé

This paper presents an original methodology to consider question answering. We noticed that query expansion is often incorrect because of a bad understanding of the question. But the automatic good understanding of an utterance is linked to the context length, and the question are often short. This methodology proposes to analyse the documents and to construct an informative structure from the results of the analysis and from a semantic text expansion. The linguistic analysis identifies words (tokenization and morphological analysis), links between words (syntactic analysis) and word sense (semantic disambiguation). The text expansion adds to each word the synonyms matching its sense and replaces the words in the utterances by derivatives, modifying the syntactic schema if necessary. In this way, whatever enrichment may be, the text keeps the same meaning, but each piece of information matches many realisations. The questioning method consists in constructing a local informative structure without enrichment, and matches it with the documentary structure. If a sentence in the informative structure matches the question structure, this sentence is the answer to the question.
Cet article présente une méthode originale d'envisager la tâche de question-réponse. Nous avons remarqué que l'expansion de requête est souvent erronée du fait d'une mécompréhension de la question. Mais la bonne compréhension d'un énoncé est fonction de la taille du contexte, et les question sont souvent courtes. Notre approche propose d'analyser les documents et de construire une structure informationnelle en utilisant les résultats de l'analyse ainsi que l'enrichissement sémantique des textes. Une analyse linguistique identifie les mots (segmentation et analyse morphologique), les liens entre les mots (analyse syntaxique) et le sens des mots (désambiguïsation sémantique lexicale). L'expansion de texte adjoint à chaque mot les synonymes qui correspondent à son acception contextuelle et remplacent les mots des énoncés par leurs dérivés, modifiant si nécessaire la structure syntaxique de la phrase. De la sorte, quel que soit l'enrichissement utilisé, le texte conserve la même signification, tandis que chaque élément d'information obtient de nombreuses actualisations. La procédure d'interrogation consiste à construire une structure informationnelle locale à la question sans effectuer d'enrichissement, et à faire lui faire correspondre un ou plusieurs fragments de la structure documentaire. Si une phrase de la structure informationnelle documentaire correspond à celle de la question, cette phrase contient la réponse à la question.
Fichier principal
Vignette du fichier
jacqueminJADTfr2004.pdf (139.69 Ko) Télécharger le fichier
presentation.pdf (164.97 Ko) Télécharger le fichier
Format : Autre

Dates et versions

hal-00005123 , version 1 (03-06-2005)

Identifiants

Citer

Bernard Jacquemin. Analyse et expansion des textes en question-réponse. Le poids des mots. Actes des septièmes Journées internationales d’Analyse statistique des Données Textuelles (JADT04), Mar 2004, Louvain-la-Neuve, Belgique. pp.633-641. ⟨hal-00005123⟩

Collections

ISC
219 Consultations
263 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More