Acquisition non supervisée de ressources morphologiques en ukrainien

Abstract : La disponibilité de ressources morphologiques est un besoin important et récurrent car elles permettent le développement des outils et applications de TAL dans une langue. De telles ressources fournissent, en effet, les informations de base dont ces outils ont besoin pour effectuer des traitements plus évolués (recherche d'information, étiquetage morpho-syntaxiques, etc). Nous proposons d'effectuer l'acquisition de ressources morphologiques pour la langue ukrainienne, qui est une langue peu dotée actuellement. La méthode proposée exploite des corpus afin d'en extraire les mots qui sont liés morphologiquement entre eux. La force d'association entre ces mots indique la probabilité du lien morphologique et sémantique entre eux. Nous utilisons trois corpus (littéraire, médical et encyclopédique) et évaluons les résultats obtenus. Selon les corpus, la précision varie entre 67 % et 86 %. Les résultats sont aussi comparés entre les corpus, ce qui montre que la redondance est assez faible. La ressource actuellement disponible contient 3 315 paires de mots validées.
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-01971309
Contributor : Limsi Publications <>
Submitted on : Sunday, January 6, 2019 - 10:42:18 PM
Last modification on : Monday, March 18, 2019 - 4:21:36 PM

Identifiers

  • HAL Id : hal-01971309, version 1

Citation

Natalia Grabar, Thierry Hamon. Acquisition non supervisée de ressources morphologiques en ukrainien. atelier Traitement Automatique des Langues Slaves, Jan 2015, Caen, France. 〈hal-01971309〉

Share

Metrics

Record views

62