Détection de la cohésion lexicale par voisinage distributionnel : application à la segmentation thématique

Résumé : Cette étude s'insère dans le projet VOILADIS (VOIsinage Lexical pour l'Analyse du DIScours), qui a pour objectif d'exploiter des marques de cohésion lexicale pour mettre au jour des phénomènes discursifs. Notre propos est de montrer la pertinence d'une ressource, construite par l'analyse distributionnelle automatique d'un corpus, pour repérer les liens lexicaux dans les textes. Nous désignons par "voisins" les mots rapprochés par l'analyse distributionnelle sur la base des contextes syntaxiques qu'ils partagent au sein du corpus. Pour évaluer la pertinence de la ressource ainsi créée, nous abordons le problème du repérage des liens lexicaux à travers une application de TAL, la segmentation thématique. Nous discutons l'importance, pour cette tâche, de la ressource lexicale mobilisée ; puis nous présentons la base de voisins distributionnels que nous utilisons ; enfin, nous montrons qu'elle permet, dans un système de segmentation thématique inspiré de [Hearst 1997], des performances supérieures à celles obtenues avec une ressource traditionnelle.
Type de document :
Communication dans un congrès
RECITAL'09, Jun 2009, Senlis, France. pp.article 6, 2009
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-00417489
Contributeur : Clémentine Adam <>
Soumis le : mercredi 16 septembre 2009 - 14:22:42
Dernière modification le : mercredi 12 septembre 2018 - 17:46:01
Document(s) archivé(s) le : mardi 15 juin 2010 - 21:59:03

Fichiers

adam2009.pdf
Fichiers éditeurs autorisés sur une archive ouverte

Identifiants

  • HAL Id : hal-00417489, version 1

Collections

Citation

Clémentine Adam, François Morlane-Hondère. Détection de la cohésion lexicale par voisinage distributionnel : application à la segmentation thématique. RECITAL'09, Jun 2009, Senlis, France. pp.article 6, 2009. 〈hal-00417489〉

Partager

Métriques

Consultations de la notice

289

Téléchargements de fichiers

742