Détection automatique de l'ironie dans les contenus générés par les utilisateurs

Jihen Karoui

Thèse Année : 2017

Automatic Irony Detection in Users Generated Content

Détection automatique de l'ironie dans les contenus générés par les utilisateurs

(1)

Jihen Karoui

Fonction : Auteur
PersonId : 17135
IdHAL : jihen-karoui
IdRef : 225147017

MEthodes et ingénierie des Langues, des Ontologies et du DIscours

Résumé

This thesis aims to detect figurative language devices in social networks. We focus in particular on irony and sarcasm in Twitter and propose an approach based on supervised learning to predict if a tweet is ironic or not. This required three steps: (1) Analyze the pragmatic phenomena of irony and a multi-level annotation of a corpus of reference, (2) Development of an automatic detection system for French tweets that exploits both semantic features and the extra-linguistic context, (3) Study of the portability of the model to detect irony in a multilingual setting (Italian, English and Arabic). The obtained results for this extremely complex task are very encouraging and will allow a significant improvement of polarity detection in sentiments analysis.

Cette thèse a pour objectif la détection du langage figuratif dans les réseaux sociaux. Nous nous focalisons en particulier sur l’ironie et le sarcasme dans Twitter et proposons une approche basée sur l’apprentissage supervisée afin de prédire si le message véhiculé dans un tweet est ironique ou non. Pour ce faire, trois étapes ont été réalisées : (1) Analyse des phénomènes pragmatiques de l’ironie et annotation multi-niveaux d’un corpus de référence, (2) Développement d’un modèle de détection automatique pour les tweets en français qui exploite à la fois des traits sémantiques et le contexte extralinguistique, (3) Etude de la portabilité du modèle pour la détection de l’ironie dans un cadre multilingue (italien, anglais et arabe). Les résultats obtenus pour cette tâche extrêmement complexe sont très encourageants et permettrons d’améliorer sensiblement la détection de polarité lors de l’analyse de sentiments.

Mots clés

annotation scheme sarcasm irony implicit opinion figurative language

opinion implicite langage figuratif schéma d'annotation sarcasme ironie

Domaines

Intelligence artificielle [cs.AI] Informatique [cs]

Fichier principal

Détection automatique de l'ironie dans les contenus générés par les utilisateurs-2.pdf (3.92 Mo)

Origine : Fichiers produits par l'(les) auteur(s)

Jihen KAROUI : Connectez-vous pour contacter le contributeur

https://hal.science/tel-01615868

Soumis le : jeudi 12 octobre 2017-17:36:37

Dernière modification le : lundi 20 novembre 2023-11:44:23

Dates et versions

tel-01615868 , version 1 (12-10-2017)

Identifiants

HAL Id : tel-01615868 , version 1

Citer

Jihen Karoui. Détection automatique de l'ironie dans les contenus générés par les utilisateurs. Intelligence artificielle [cs.AI]. Université de Toulouse 3 Paul Sabatier; Faculté des Sciences Economiques et de Gestion, Université de Sfax (Tunisie), 2017. Français. ⟨NNT : ⟩. ⟨tel-01615868⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-TLSE2 CNRS SMS UT1-CAPITOLE IRIT IRIT-MELODI IRIT-IA TOULOUSE-INP UNIV-UT3 UT3-TOULOUSEINP

8980 Consultations

1157 Téléchargements

Automatic Irony Detection in Users Generated Content

Détection automatique de l'ironie dans les contenus générés par les utilisateurs

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager