Marqueurs de reformulation : Exploration outillée et contrastive dans deux corpus

Véronique Magri 1
1 BCL, équipe Logométrie : corpus, traitements, modèles
BCL - Bases, Corpus, Langage (UMR 7320 - UNS / CNRS)
Abstract : Cet article se donne pour objectif de mettre à l’épreuve le processus de la reformulation et les théories qui l’expliquent par une recherche outillée dans un grand corpus numérique et contrastif. Une première étape consiste en l’observation des données qui précède celle de l’analyse, avant d’espérer, sinon renouveler, du moins étayer ou affiner les analyses de la reformulation à partir d’exemples attestés. L’observatoire choisi est un extrait de la base de données textuelles, Frantext. Il met en contraste deux ensembles génériques homogènes en ce qu’ils adoptent tous deux le moule narratif. Ils diffèrent cependant l’un de l’autre par leurs enjeux pragmatiques et leur relation affichée au référent. L’un est composé de 13 récits de voyage [1 210 080 mots] et se définit comme ensemble générique factuel ; l’autre regroupe l’ensemble des Contes (14 textes – les Contes et Nouvelles de Maupassant étant répartis en plusieurs fragments) et des nouvelles (7 textes) [461 522 et 570 193 mots soit 1 031 715 mots] de la base et illustre le genre fictionnel.Les deux ensembles sont équilibrés en termes quantitatifs (environ un million de mots pour chacun d’eux) afin que les résultats chiffrés soient plus pertinents ; ils sont homogènes quant à la période chronologique couverte (depuis la mi-XIXe siècle jusqu’à la deuxième moitié du XXe siècle ; les récits de voyage se situent entre 1835 et 1963 et les Contes et Nouvelles entre 1877-1936 précisément). Dans ce corpus, la recherche automatique me permet de repérer les outils qui servent le processus de reformulation, défini comme modalité de retour sur un dire antérieur, avec deux réalisations : la reformulation corrective qui utilise la forme prototypique « ou plutôt » et la reformulation alternative qui passe par les outils tels « c’est-à-dire, autrement dit, ce qui veut dire ». Les mesures quantitatives valideront ou non l’hypothèse d’une différenciation générique quant à l’emploi de ces outils. La recherche automatique facilite bien entendu le repérage des items recherchés et autorisent la fouille de très grands corpus et de masses de données – à partir de laquelle des tendances majoritaires peuvent se dessiner. Elle a aussi cette vertu heuristique de repérer les absences, ce que l’œil du chercheur ne peut jamais percevoir seul.
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-01970495
Contributeur : Véronique Magri <>
Soumis le : samedi 5 janvier 2019 - 12:56:55
Dernière modification le : jeudi 7 février 2019 - 15:55:34

Identifiants

  • HAL Id : hal-01970495, version 1

Collections

Citation

Véronique Magri. Marqueurs de reformulation : Exploration outillée et contrastive dans deux corpus. Langages, Armand Colin (Larousse jusqu'en 2003), 2018, Reformulations, pp.35-50. 〈http://www.revues.armand-colin.com/lettres-langues/langages/langages-ndeg-212-42018/marqueurs-reformulation-exploration-outillee-contrastive-deux-corpus-narratifs et https://www.cairn.info/revue-langages-2018-4.htm〉. 〈hal-01970495〉

Partager

Métriques

Consultations de la notice

26