Extraction d'information conceptuelle de textes, basée sur une annotation interlingue et guidée par une ontologie

Résumé : Nous proposons dans ce papier une méthode générique (indépendante de la langue et du domaine) permettant d'extraire des informations conceptuelles à partir de textes. Une ontologie de domaine, considérée comme un paramètre du système, détermine les informations pertinentes et guide le processus d'extraction. Les textes sont lemmatisés puis annotés par des lexèmes interlingues, ce qui permet à la majeure partie du processus de rester indépendante de la langue. Un alignement automatique entre l'ontologie et le lexique interlingue permet, ensuite, l'identification des concepts présents dans le texte. Notre méthode est implémentée suivant une architecture distribuée, orientée services. Par ailleurs, dans le cadre, du projet ANR OMNIA, elle est combinée avec des analyses visuelles pour l'indexation de documents bimodaux (images et textes).
Type de document :
Communication dans un congrès
Atelier RISE 2011, CORIA 2011, 2011, Avignon, pp.x-x, 2011
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-00959150
Contributeur : Gilles Sérasset <>
Soumis le : vendredi 14 mars 2014 - 09:18:28
Dernière modification le : jeudi 11 octobre 2018 - 08:48:03

Identifiants

  • HAL Id : hal-00959150, version 1

Citation

David Rouquet, Achille Falaise. Extraction d'information conceptuelle de textes, basée sur une annotation interlingue et guidée par une ontologie. Atelier RISE 2011, CORIA 2011, 2011, Avignon, pp.x-x, 2011. 〈hal-00959150〉

Partager

Métriques

Consultations de la notice

66