Indexation semi automatique de corpus multilingues basée sur une ontologie

Résumé : Ce travail s’intègre dans la problématique générale liée à l’indexation de documents multilingues et la représentation de la sémantique des textes. Dans cet article nous proposons une approche d’indexation automatique des documents multilingues. L’approche présentée est générique sur la dimension langue. En effet, elle s’applique sur un corpus multilingue où les langues sont mélangées et inconnues a priori. Notre approche se base d’une part sur des propriétés générales des langues et d’autre part sur des analyses statistiques et quantitatives d’indexation des documents multilingues. La principale contribution de notre approche est de proposer une méthode d’extraction des concepts applicable à toutes les langues contenues dans l’ontologie
Document type :
Conference papers
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-01562920
Contributor : Équipe Gestionnaire Des Publications Si Liris <>
Submitted on : Monday, July 17, 2017 - 11:07:13 AM
Last modification on : Friday, January 11, 2019 - 4:35:38 PM

Identifiers

  • HAL Id : hal-01562920, version 1

Citation

Farah Harrathi, Sylvie Calabretto, Catherine Roussey. Indexation semi automatique de corpus multilingues basée sur une ontologie. Colloque Indice, Index, indexation, Nov 2005, Lille, France. pp.203-219. ⟨hal-01562920⟩

Share

Metrics

Record views

117