Détection automatique de phénomènes intertextuels - Archive ouverte HAL Accéder directement au contenu
Article Dans Une Revue Genesis (Manuscrits - Recherche - Invention) Année : 2021

Détection automatique de phénomènes intertextuels

Résumé

Il est désormais possible de détecter automatiquement, avec des techniques inspirées de la détection de plagiats, des fragments textuels évoquant, du fait de leurs ressemblances, des citations ou des réutilisations. Cependant, lorsque la taille des corpus est conséquente, le nombre de similitudes détectées est si grand qu’on s’y perd. De plus, des expressions figées ou des clichés enfouissent les reprises les plus intéressantes. De façon analogue, on peut repérer, sur les disques durs d’écrivains, des fichiers très semblables correspondant soit à des duplications, soit à des états différents d’un même écrit. Là encore, le nombre de fichiers semblables apparaît vertigineux. Pour surmonter ces difficultés, nous proposons de représenter les grandes masses de similitudes textuelles sur des graphes et de tirer parti des opérateurs mathématiques sur les graphes, en particulier de la détection de « communautés » ou d’arbres couvrant minimaux, pour les regrouper de manière significative.

Dates et versions

hal-03128043 , version 1 (01-02-2021)

Identifiants

Citer

Jean-Gabriel Ganascia. Détection automatique de phénomènes intertextuels. Genesis (Manuscrits - Recherche - Invention), 2021, 51, pp.63-77. ⟨10.4000/genesis.5671⟩. ⟨hal-03128043⟩
76 Consultations
0 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More