Des motifs séquentiels aux motifs hiérarchiques : l'apport des arbres lexico-syntaxiques récurrents pour le repérage des routines discursives - Archive ouverte HAL Accéder directement au contenu
Article Dans Une Revue Corpus Année : 2017

From sequential to hierarchical motifs : what can bring Recurrent Lexico-syntactic Trees to the identification of discursive routines

Des motifs séquentiels aux motifs hiérarchiques : l'apport des arbres lexico-syntaxiques récurrents pour le repérage des routines discursives

Résumé

This article proposes a theoretical and methodological reflection in the field of extended phraseology, which focuses on prefabricated units of discourse. More precisely, we try to clarify the concepts of motif and discursive routine. We propose to compare two different methodological approaches for the identification of routines in corpora: a hierarchical method based on the identification of Recurrent Lexico-syntactic Trees (RLT) and the classical sequential n-gram method. We show, through a corpus study, that the ALR method has a real interest in spotting routines and collocations, but that the n-grams seem more adapted and easier to implement for frozen locutions or syntactic constructions. The underlying syntactic model of ALR would require some adaptation to be able to identify these latter cases.
Cet article propose une réflexion à la fois théorique et méthodologique sur les objets de la phraséologie étendue, qui s'intéresse à des unités préfabriquées du discours au-delà des critères de figement. Plus précisément, nous tentons de clarifier le concept général de motif, ainsi que celui, plus spécifique, de routine discursive. Nous proposons ensuite de comparer deux approches méthodologiques différentes pour l'identification des routines en corpus : une méthode hiérarchique, basé sur le repérage d'arbres lexico-syntaxiques récurrents (ALR), et la méthode séquentielle classique des segments répétés (SR) ou n-grams. Nous montrons, au travers d'une étude sur corpus, que la méthode des ALR présente un réel intérêt pour le repérage des routines et des collocations, mais que les SR semblent plus adaptés et plus simples à mettre en oeuvre pour des locutions figées ou des constructions syntaxiques impliquant des lexèmes grammaticaux-le modèle syntaxique des ALR nécessitant une adaptation pour pouvoir identifier ces cas.
Fichier principal
Vignette du fichier
Article RevueCorpus KraifTutin avecRésumé final.pdf (459.6 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01884897 , version 1 (01-10-2018)

Identifiants

  • HAL Id : hal-01884897 , version 1

Citer

Olivier Kraif, Agnès Tutin. Des motifs séquentiels aux motifs hiérarchiques : l'apport des arbres lexico-syntaxiques récurrents pour le repérage des routines discursives. Corpus, 2017, 17. ⟨hal-01884897⟩

Collections

UGA LIDILEM ANR
84 Consultations
95 Téléchargements

Partager

Gmail Facebook X LinkedIn More