Fouille de données pour la stylistique : cas des motifs séquentiels émergents

Solen Quiniou 1, 2 Peggy Cellier 3 Thierry Charnois 1 Dominique Legallois 2
1 Equipe CODAG - Laboratoire GREYC - UMR6072
GREYC - Groupe de Recherche en Informatique, Image, Automatique et Instrumentation de Caen
3 LIS - Logical Information Systems
IRISA-D7 - GESTION DES DONNÉES ET DE LA CONNAISSANCE
Résumé : Dans cet article, nous présentons une étude sur l'utilisation de méthodes de fouille de données pour l'analyse stylistique - d'un point de vue linguistique - en considérant des motifs séquentiels émergents. Nous montrons tout d'abord que la fouille de motifs séquentiels de mots en utilisant la contrainte gap permet d'obtenir de nouveaux patrons linguistiques pertinents par rapport aux patrons construits à partir de n-grammes. Nous étudions ensuite l'utilisation de motifs séquentiels d'itemsets pour produire des patrons linguistiques plus généraux. Nous validons notre approche d'un point de vue quantitatif et d'un point de vue linguistique, en réalisant des expérimentations sur trois corpus français correspondant à différents genres de texte (la poésie, les correspondances et les romans, respectivement). En considérant plus particulièrement les textes poétiques, nous montrons que les techniques de fouille de données employées permettent d'identifier des patrons linguistiques caractéristiques.
Type de document :
Communication dans un congrès
Journées Internationales d'Analyse Statistique des Données Textuelles (JADT'12), Jun 2012, Liège, Belgique. pp.821-833, 2012
Liste complète des métadonnées

Littérature citée [10 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-00675586
Contributeur : Solen Quiniou <>
Soumis le : jeudi 1 mars 2012 - 15:08:39
Dernière modification le : mardi 5 juin 2018 - 10:14:41
Document(s) archivé(s) le : jeudi 14 juin 2012 - 17:05:45

Fichier

jadt2012.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00675586, version 1

Citation

Solen Quiniou, Peggy Cellier, Thierry Charnois, Dominique Legallois. Fouille de données pour la stylistique : cas des motifs séquentiels émergents. Journées Internationales d'Analyse Statistique des Données Textuelles (JADT'12), Jun 2012, Liège, Belgique. pp.821-833, 2012. 〈hal-00675586〉

Partager

Métriques

Consultations de la notice

549

Téléchargements de fichiers

544