Modèle Hiérarchique de Recherche et d'Extraction de l'Information Textuelle de Surface - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 1998

Modèle Hiérarchique de Recherche et d'Extraction de l'Information Textuelle de Surface

Résumé

Nous présentons une application de techniques d’apprentissage numérique au domaine de l’extraction d’information textuelle. Ce n’est que très récemment que les techniques d’apprentissage ont commencé à être utilisées dans ce domaine. Le système proposé est hiérarchique et réalise successivement la localisation, l’extraction et l’étiquetage des mots pertinents à une requête prédéterminée, au sein d’un corpus d’articles. Chaque niveau de la hiérarchie correspond à un niveau structurel du corpus (document, section, paragraphe, ...), cela nous permet d’une part d’éliminer l’information non pertinente dès que possible, d’autre part d’améliorer la sélection d’information pertinente à chaque niveau. Au dernier niveau, l’analyse de séquences de mots est faite à l’aide de modèles de Markov Cachés.
Fichier non déposé

Dates et versions

hal-01622605 , version 1 (24-10-2017)

Identifiants

  • HAL Id : hal-01622605 , version 1

Citer

Hugo Zaragoza, Patrick Gallinari. Modèle Hiérarchique de Recherche et d'Extraction de l'Information Textuelle de Surface. Journées Francophones d'Apprentissage, 1998, Arras, France. ⟨hal-01622605⟩
67 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More