Fouille de graphes sous contraintes linguistiques pour l'exploration de grands textes - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2012

Graph Mining Under Linguistic Constraints to Explore LargeTexts

Fouille de graphes sous contraintes linguistiques pour l'exploration de grands textes

Résumé

In this paper, we propose an approach to explore large texts by highlighting coherent sub-parts.The exploration method relies on a graph representation of the text according to the Hoeylinguistic model which allows the selection and the bindingof sentences in the graph. Ourcontribution relates to using graph mining techniques under constraints to extract relevant sub-parts of the text (i.e., collections of homogeneous sentence sub-networks). We have conductedsome experiments on two large English texts to show the interest of the proposed approach.
Dans cet article, nous proposons une approche pour explorer des textes de taille importante en mettant en évidence des sous-parties cohérentes. Cette méthode d'exploration s'appuie sur une représentation en graphe du texte, en utilisant le modèle linguistique de Hoey pour sélectionner et apparier les phrases dans le graphe. Notre contribution porte sur l'utilisation de techniques de fouille de graphes sous contraintes pour extraire des sous-parties pertinentes du texte (c'est-à-dire des collections de sous-réseaux phrastiques homogènes). Nous avons réalisé des expérimentations sur deux textes anglais de taille conséquente pour montrer l'intérêt de l'approche que nous proposons.
Fichier principal
Vignette du fichier
quiniou12bfouille.pdf (596.92 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00702606 , version 1 (30-05-2012)

Identifiants

  • HAL Id : hal-00702606 , version 1

Citer

Solen Quiniou, Peggy Cellier, Thierry Charnois, Dominique Legallois. Fouille de graphes sous contraintes linguistiques pour l'exploration de grands textes. Conférence sur le Traitement Automatique des Langues Naturelles (TALN'12), Jun 2012, Grenoble, France. pp.253-266. ⟨hal-00702606⟩
364 Consultations
224 Téléchargements

Partager

Gmail Facebook X LinkedIn More