Catégorisation multi-thématique de dialogues téléphoniques

Résumé : Ce papier porte sur l'analyse automatique de dialogues téléphoniques entre un client et un agent d'un centre d'appel d'un service clientèle. Le but de l'analyse est d'identifier, parmi un ensemble thématique prédéfini, les thèmes des problèmes évoqués dans le dialogue. Un dialogue peut contenir des thèmes multiples mentionnés dans des segments entremêlés difficiles à délimiter. Deux méthodes sont proposées pour conjecturer les thèmes multiples. La première repose sur une mesure de similarité cosine appliquée au sac de mots extrait de la totalité du dialogue. La seconde méthode introduit le concept de densité thématique distribuée autour de positions spécifiques du dialogue. En plus des unigrammes, sont également pris en compte les bigrammes, avec d'éventuels trous entre les deux termes. Les résultats expérimentaux obtenus par les méthodes proposées apparaissent supérieurs à ceux obtenus par des machines à support de vecteurs appliquées aux mêmes données.
Complete list of metadatas

Cited literature [9 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-01967848
Contributor : Xavier Bost <>
Submitted on : Tuesday, January 1, 2019 - 5:26:24 PM
Last modification on : Saturday, March 23, 2019 - 1:22:12 AM
Long-term archiving on : Tuesday, April 2, 2019 - 8:03:15 PM

File

bostCat2014.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-01967848, version 1

Collections

Citation

Xavier Bost, Marc El-Bèze, Renato de Mori. Catégorisation multi-thématique de dialogues téléphoniques. XXXe édition des Journées d’Études sur la Parole (JEP 2014), Jun 2014, Le Mans, France. ⟨hal-01967848⟩

Share

Metrics

Record views

10

Files downloads

6