Une approche hybride pour la segmentation automatique de documents juridiques - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2019

Une approche hybride pour la segmentation automatique de documents juridiques

Fadila Taleb
  • Fonction : Auteur
Eric Trupin
  • Fonction : Auteur
  • PersonId : 836636
Youssouf Saidali
  • Fonction : Auteur
  • PersonId : 1070108
Maryvonne Holzem
Jacques Labiche
  • Fonction : Auteur
  • PersonId : 1070107

Résumé

Cet article 1 propose une approche hybride pour la segmentation de documents basée sur l’agrégation de différentes solutions. Divers algorithmes de segmentation peuvent être utilisés dans le système, ce qui permet la combinaison de stratégies multiples (spécifiques au domaine, supervisées et nonsupervisées). Un ensemble de documents étiquetés, segmentés au préalable et représentatif du domaine ciblé, doit être fourni pour être utilisé comme ensemble d’entraînement pour l’apprentissage des méthodes supervisées, et aussi comme ensemble de test pour l’évaluation de la performance de chaque méthode, ce qui déterminera leur poids lors de la phase d’agrégation. L’approche proposée présente de bonnes performances dans un scénario expérimental issu d’un corpus extrait du domaine juridique.
Fichier principal
Vignette du fichier
39.pdf (174.1 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte
Loading...

Dates et versions

hal-02567788 , version 1 (30-05-2020)

Licence

Paternité - Pas d'utilisation commerciale - Pas de modification

Identifiants

  • HAL Id : hal-02567788 , version 1

Citer

Filipo Studzinski Perotto, Fadila Taleb, Eric Trupin, Youssouf Saidali, Maryvonne Holzem, et al.. Une approche hybride pour la segmentation automatique de documents juridiques. 26e Conférence sur le Traitement Automatique des Langues Naturelles, 2019, Toulouse, France. pp.455-464. ⟨hal-02567788⟩
206 Consultations
10 Téléchargements

Partager

Gmail Facebook X LinkedIn More