Repérer automatiquement les segments obsolescents à l'aide d'indices sémantiques et discursifs - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2009

Repérer automatiquement les segments obsolescents à l'aide d'indices sémantiques et discursifs

Résumé

Cet article vise la description et le repérage automatique de segments contenant de l'obsolescence dans les documents de type encyclopédique. Nous supposons, malgré le carac- tère non linguistique de ce phénomène, que des indices discursifs permettent le repérage de ces segments. Nous travaillons sur un corpus annoté manuellement par des experts sur lequel nous projetons des indices repérés automatiquement. Nous utilisons des techniques d'apprentissage automatique pour évaluer le pouvoir prédictif de nos indices. À l'aide de techniques de classifi- cation supervisée, nous montrons que nos hypothèses sont pertinentes et permettent d'envisager le déploiement d'une méthode automatique pour l'aide au repérage de segments obsolescents.------ ABSTRACT : This paper deals with the description and the automatic tracking of text segments containing obsolescence in encyclopedia texts. We assume that despite the non-linguistic nature of this phenomenon, discursive cues are relevant to track those segments. For that purpose, we have worked on a corpus which has been manually annotated by experts and on which we have projected automatically tracked cues. We use machine learning techniques to evaluate the predictive power of our cues. We show, using supervised classification, that our hypotheses enable us to build an automatic procedure to assist human experts.
Fichier principal
Vignette du fichier
ACTI-LAIGNELET-2009-2.pdf (8.87 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-01012442 , version 1 (17-07-2014)

Identifiants

  • HAL Id : hal-01012442 , version 1

Citer

Marion Laignelet, François Rioult. Repérer automatiquement les segments obsolescents à l'aide d'indices sémantiques et discursifs. Actes de la 16ème conférence Traitement Automatique des Langues Naturelles (TALN'09), Jun 2009, Senlis, France. 10p. ⟨hal-01012442⟩
195 Consultations
72 Téléchargements

Partager

Gmail Facebook X LinkedIn More