Analyse morphologique non supervisée en domaine biomédical. Application à la recherche d'information

Vincent Claveau 1 Ewa Kijak 1
1 TEXMEX - Multimedia content-based indexing
IRISA - Institut de Recherche en Informatique et Systèmes Aléatoires, Inria Rennes – Bretagne Atlantique
Résumé : Dans le domaine biomédical, utiliser des termes spécialisés est essentiel pour accéder à l'information. Cependant, dans beaucoup de langues, ces termes sont des constructions morphologiques complexes qui compliquent cet accès à l'information. Dans cet article, nous nous intéressons à l'identification des composants morphologiques de ces termes et à leur utilisation pour une tâche de recherche d'information (RI). Nous proposons différentes approches reposant sur un alignement automatique avec une langue pivot particulière, le japonais, et sur un apprentissage par analogie permettant de produire des analyses morphologiques fines des termes d'une langue donnée. Ces analyses morphologiques sont ensuite utilisées pour améliorer l'indexation de documents biomédicaux. Les expériences rapportées montrent la validité de cette approche avec des gains en MAP de plus de 10 % par rapport à un système de RI standard.
Complete list of metadatas

Cited literature [54 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-00912301
Contributor : Vincent Claveau <>
Submitted on : Sunday, December 1, 2013 - 10:06:54 PM
Last modification on : Friday, November 16, 2018 - 1:22:03 AM
Long-term archiving on : Monday, March 3, 2014 - 8:46:49 PM

File

Claveau_TAL.pdf
Publisher files allowed on an open archive

Identifiers

  • HAL Id : hal-00912301, version 1

Citation

Vincent Claveau, Ewa Kijak. Analyse morphologique non supervisée en domaine biomédical. Application à la recherche d'information. Traitement Automatique des Langues, ATALA, 2013, 54 (1), pp.54-1. ⟨hal-00912301⟩

Share

Metrics

Record views

355

Files downloads

388