Représentation sémantique distributionnelle et alignement de conversations par chat - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2019

Distributional semantic representation and alignment of online chat conversations

Représentation sémantique distributionnelle et alignement de conversations par chat

Résumé

Les mesures de similarité textuelle ont une place importante en TAL, du fait de leurs nombreuses applications, en recherche d'information et en classification notamment. En revanche, le dialogue fait moins l'objet d'attention sur cette question. Nous nous intéressons ici à la production d'une similarité dans le contexte d'un corpus de conversations par chat à l'aide de méthodes non-supervisées, exploitant à différents niveaux la notion de sémantique distributionnelle, sous forme d'embeddings. Dans un même temps, pour enrichir la mesure, et permettre une meilleure interprétation des résultats, nous établissons des alignements explicites des tours de parole dans les conversations, en exploitant la distance de Wasserstein, qui permet de prendre en compte leur dimension structurelle. Enfin, nous évaluons notre approche à l'aide d'une tâche externe sur la petite partie annotée du corpus, et observons qu'elle donne de meilleurs résultats qu'une variante plus na\"ıve à base de moyennes.
Fichier non déposé

Dates et versions

hal-02567782 , version 1 (08-05-2020)

Identifiants

  • HAL Id : hal-02567782 , version 1

Citer

Tom Bourgeade, Philippe Muller. Représentation sémantique distributionnelle et alignement de conversations par chat. Conférence sur le Traitement Automatique des Langues Naturelles (TALN - PFIA 2019), Jul 2019, Toulouse, France. pp.399-408. ⟨hal-02567782⟩
76 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More