Le deep learning comme défi pour identifier le style d'un écrivain : l'exemple de Jean Giono - Archive ouverte HAL Accéder directement au contenu
Chapitre D'ouvrage Année : 2020

Le deep learning comme défi pour identifier le style d'un écrivain : l'exemple de Jean Giono

Résumé

What if artificial intelligence could identify a writer's style ? What if, automatically, the machine could identify the characteristics of a piece of writing, in other words the formal elements recognizable from one work to another, as well as the differences between a corpus of study and a reference corpus ? If finally a writing could be deciphered by an algorithm ? This is precisely the challenge of deep learning applied to literature. This is exactly the experimentation that is being attempted on Giono, from an unpublished digital text base, a very large corpus that brings together Giono's novels. The necessary differential measurement guides the constitution of the corpus ; two bases were thus constituted by É. Brunet : one brings together Giono's works, processed by the Hyperbase software. The other is a vast reference corpus whose generic and temporal homogeneity is guaranteed since they are 50 novels from the twentieth to the twenty-first centuries. The corpus was constituted by É. Brunet and includes two texts written by the same author, i.e. 50 texts for 25 authors. From prediction to deconvolution, an interpretative path is built, tending towards the horizon of the discovery of an author's style.
Et si l'intelligence artificielle parvenait à identifier le style d'un écrivain ? Et si, de manière automatique, la machine parvenait à identifier les caractéristiques d'une écriture, autrement dit les éléments formels reconnaissables d'une oeuvre à l'autre, de même que les différences d'un corpus d'étude par rapport à un corpus de référence ? Si finalement une écriture pouvait être décryptée par un algorithme ? C'est précisément le défi que lance le deep learning appliqué à la littérature. C'est exactement l'expérimentation qui est tentée sur Giono, à partir d'une base de textes numériques inédite, un très grand corpus qui rassemble les oeuvres romanesques de Giono. La mesure différentielle nécessaire guide la constitution des corpus ; deux bases ont ainsi été constituées par É. Brunet : l'une réunit les oeuvres de Giono, traitées par le logiciel Hyperbase. L'autre est un vaste corpus de référence dont l'homogénéité générique et temporelle est garantie puisqu'il s'agit de 50 romans du XX e au XXI e siècles. Le corpus a été constitué par É. Brunet et comporte deux textes du même auteur soit 50 textes pour 25 auteurs. De la prédiction à la déconvolution se construit un parcours interprétatif tendu vers l'horizon de la découverte d'un style d'auteur.
Fichier principal
Vignette du fichier
MagriV_jadt2020_relu.pdf (2.37 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-02936437 , version 1 (11-09-2020)

Identifiants

  • HAL Id : hal-02936437 , version 1

Citer

Véronique Magri. Le deep learning comme défi pour identifier le style d'un écrivain : l'exemple de Jean Giono. JADT, 2020. ⟨hal-02936437⟩
141 Consultations
129 Téléchargements

Partager

Gmail Facebook X LinkedIn More