Modèle Hiérarchique de Recherche et d'Extraction de l'Information Textuelle de Surface

Hugo Zaragoza 1 Patrick Gallinari 1
1 APA - Apprentissage et Acquisition des connaissances
LIP6 - Laboratoire d'Informatique de Paris 6
Résumé : Nous présentons une application de techniques d’apprentissage numérique au domaine de l’extraction d’information textuelle. Ce n’est que très récemment que les techniques d’apprentissage ont commencé à être utilisées dans ce domaine. Le système proposé est hiérarchique et réalise successivement la localisation, l’extraction et l’étiquetage des mots pertinents à une requête prédéterminée, au sein d’un corpus d’articles. Chaque niveau de la hiérarchie correspond à un niveau structurel du corpus (document, section, paragraphe, ...), cela nous permet d’une part d’éliminer l’information non pertinente dès que possible, d’autre part d’améliorer la sélection d’information pertinente à chaque niveau. Au dernier niveau, l’analyse de séquences de mots est faite à l’aide de modèles de Markov Cachés.
Document type :
Conference papers
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-01622605
Contributor : Lip6 Publications <>
Submitted on : Tuesday, October 24, 2017 - 3:07:39 PM
Last modification on : Thursday, March 21, 2019 - 12:59:33 PM

Identifiers

  • HAL Id : hal-01622605, version 1

Citation

Hugo Zaragoza, Patrick Gallinari. Modèle Hiérarchique de Recherche et d'Extraction de l'Information Textuelle de Surface. Journées Francophones d'Apprentissage, 1998, Arras, France. ⟨hal-01622605⟩

Share

Metrics

Record views

31