Acquisition non supervisée de ressources morphologiques en ukrainien

Abstract : La disponibilité de ressources morphologiques est un besoin important et récurrent car elles permettent le développement des outils et applications de TAL dans une langue. De telles ressources fournissent, en effet, les informations de base dont ces outils ont besoin pour effectuer des traitements plus évolués (recherche d'information, étiquetage morpho-syntaxiques, etc). Nous proposons d'effectuer l'acquisition de ressources morphologiques pour la langue ukrainienne, qui est une langue peu dotée actuellement. La méthode proposée exploite des corpus afin d'en extraire les mots qui sont liés morphologiquement entre eux. La force d'association entre ces mots indique la probabilité du lien morphologique et sémantique entre eux. Nous utilisons trois corpus (littéraire, médical et encyclopédique) et évaluons les résultats obtenus. Selon les corpus, la précision varie entre 67 % et 86 %. Les résultats sont aussi comparés entre les corpus, ce qui montre que la redondance est assez faible. La ressource actuellement disponible contient 3 315 paires de mots validées.
Type de document :
Communication dans un congrès
atelier Traitement Automatique des Langues Slaves, Jan 2015, Caen, France
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-01971309
Contributeur : Limsi Publications <>
Soumis le : dimanche 6 janvier 2019 - 22:42:18
Dernière modification le : mercredi 13 février 2019 - 01:26:18

Identifiants

  • HAL Id : hal-01971309, version 1

Citation

Natalia Grabar, Thierry Hamon. Acquisition non supervisée de ressources morphologiques en ukrainien. atelier Traitement Automatique des Langues Slaves, Jan 2015, Caen, France. 〈hal-01971309〉

Partager

Métriques

Consultations de la notice

32