Détection automatique de l'ironie dans les contenus générés par les utilisateurs - Archive ouverte HAL Accéder directement au contenu
Thèse Année : 2017

Automatic Irony Detection in Users Generated Content

Détection automatique de l'ironie dans les contenus générés par les utilisateurs

Résumé

This thesis aims to detect figurative language devices in social networks. We focus in particular on irony and sarcasm in Twitter and propose an approach based on supervised learning to predict if a tweet is ironic or not. This required three steps: (1) Analyze the pragmatic phenomena of irony and a multi-level annotation of a corpus of reference, (2) Development of an automatic detection system for French tweets that exploits both semantic features and the extra-linguistic context, (3) Study of the portability of the model to detect irony in a multilingual setting  (Italian, English and Arabic). The obtained results for this extremely complex task are very encouraging and will allow a significant improvement of polarity detection in sentiments analysis.
Cette thèse a pour objectif la détection du langage figuratif dans les réseaux sociaux. Nous nous focalisons en particulier sur l’ironie et le sarcasme dans Twitter et proposons une approche basée sur l’apprentissage supervisée afin de prédire si le message véhiculé dans un tweet est ironique ou non. Pour ce faire, trois étapes ont été réalisées : (1) Analyse des phénomènes pragmatiques de l’ironie et annotation multi-niveaux d’un corpus de référence, (2) Développement d’un modèle de détection automatique pour les tweets en français qui exploite à la fois des traits sémantiques et le contexte extralinguistique, (3) Etude de la portabilité du modèle pour la détection de l’ironie dans un cadre multilingue (italien, anglais et arabe). Les résultats obtenus pour cette tâche extrêmement complexe sont très encourageants et permettrons d’améliorer sensiblement la détection de polarité lors de l’analyse de sentiments.
Fichier principal
Vignette du fichier
Détection automatique de l'ironie dans les contenus générés par les utilisateurs-2.pdf (3.92 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

tel-01615868 , version 1 (12-10-2017)

Identifiants

  • HAL Id : tel-01615868 , version 1

Citer

Jihen Karoui. Détection automatique de l'ironie dans les contenus générés par les utilisateurs. Intelligence artificielle [cs.AI]. Université de Toulouse 3 Paul Sabatier; Faculté des Sciences Economiques et de Gestion, Université de Sfax (Tunisie), 2017. Français. ⟨NNT : ⟩. ⟨tel-01615868⟩
8980 Consultations
1157 Téléchargements

Partager

Gmail Facebook X LinkedIn More