Extraction de thèmes d'un corpus de demandes de support pour un logiciel de relation citoyen - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2020

Extraction de thèmes d'un corpus de demandes de support pour un logiciel de relation citoyen

Christophe Bortolaso
Mustapha Derras
  • Fonction : Auteur
  • PersonId : 972011

Résumé

Nous nous intéressons dans cet article à l’extraction de thèmes (topics) à partir de commentaires textuels provenant des demandes de support de l’éditeur de logiciel Berger-Levrault. Le corpus de demandes analysé est celui d’un outil de gestion de la relation citoyen. Ce corpus n’est pas formaté et est peu structuré avec plusieurs locuteurs qui interviennent (le citoyen et un ou plusieurs techniciens support). Nous décrivons une étude expérimentale qui repose sur l’utilisation de deux systèmes. Le premier système applique une LDA (Allocation Dirichlet Latente), tandis que le second combine l’application d’une LDA avec l’algorithme k-Moyennes (k-Means). Nous comparons nos résultats avec un échantillon de ce corpus, annoté par un expert du domaine. Nos résultats montrent que nous obtenons une classification de meilleure qualité comparable avec celle effectuée manuellement par un expert en utilisant une combinaison LDA/k-Moyennes.
Fichier principal
Vignette du fichier
51.pdf (517.12 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte
Loading...

Dates et versions

hal-02784763 , version 1 (07-06-2020)
hal-02784763 , version 2 (18-06-2020)
hal-02784763 , version 3 (23-06-2020)

Identifiants

  • HAL Id : hal-02784763 , version 3

Citer

Mokhtar Boumedyen Billami, Christophe Bortolaso, Mustapha Derras. Extraction de thèmes d'un corpus de demandes de support pour un logiciel de relation citoyen. 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 2 : Traitement Automatique des Langues Naturelles, 2020, Nancy, France. pp.155-163. ⟨hal-02784763v3⟩
143 Consultations
570 Téléchargements

Partager

Gmail Facebook X LinkedIn More