Fouille de données pour la stylistique : cas des motifs séquentiels émergents

Solen Quiniou 1, 2 Peggy Cellier 3 Thierry Charnois 1 Dominique Legallois 2
1 Equipe CODAG - Laboratoire GREYC - UMR6072
GREYC - Groupe de Recherche en Informatique, Image, Automatique et Instrumentation de Caen
3 LIS - Logical Information Systems
IRISA-D7 - GESTION DES DONNÉES ET DE LA CONNAISSANCE
Résumé : Dans cet article, nous présentons une étude sur l'utilisation de méthodes de fouille de données pour l'analyse stylistique - d'un point de vue linguistique - en considérant des motifs séquentiels émergents. Nous montrons tout d'abord que la fouille de motifs séquentiels de mots en utilisant la contrainte gap permet d'obtenir de nouveaux patrons linguistiques pertinents par rapport aux patrons construits à partir de n-grammes. Nous étudions ensuite l'utilisation de motifs séquentiels d'itemsets pour produire des patrons linguistiques plus généraux. Nous validons notre approche d'un point de vue quantitatif et d'un point de vue linguistique, en réalisant des expérimentations sur trois corpus français correspondant à différents genres de texte (la poésie, les correspondances et les romans, respectivement). En considérant plus particulièrement les textes poétiques, nous montrons que les techniques de fouille de données employées permettent d'identifier des patrons linguistiques caractéristiques.
Complete list of metadatas

Cited literature [10 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-00675586
Contributor : Solen Quiniou <>
Submitted on : Thursday, March 1, 2012 - 3:08:39 PM
Last modification on : Thursday, February 7, 2019 - 5:39:12 PM
Long-term archiving on: Thursday, June 14, 2012 - 5:05:45 PM

File

jadt2012.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-00675586, version 1

Citation

Solen Quiniou, Peggy Cellier, Thierry Charnois, Dominique Legallois. Fouille de données pour la stylistique : cas des motifs séquentiels émergents. Journées Internationales d'Analyse Statistique des Données Textuelles (JADT'12), Jun 2012, Liège, Belgique. pp.821-833. ⟨hal-00675586⟩

Share

Metrics

Record views

677

Files downloads

738