Conception, implémentation et indexation de BaLeM, une base lexicale multilingue
Résumé
En Traitement Automatique des Langues Naturelles (TALN), le problème de la gestion des ressources linguistiques est crucial. Le volume des données manipulées, leur grande variété et la vitesse de traduction sont autant de paramètres qui font de la construction de dictionnaires un élément clé de tout système de TALN. La dispersion des outils sur des plates-formes hétérogènes dont les lexicographes ont besoin lors de l'indexation et le coût élevé qui en résulte freinent les avancées dans ce domaine. Beaucoup d'efforts ont été faits pour essayer de créer une plate-forme unique qui réduirait les coûts de production des dictionnaires mais peu de résultats ont été obtenus. D'autre part, pour le projet Universal Networking Language, nous devons faire face à des besoins très importants. À court terme, des outils d'indexation pour construire les dictionnaires seront nécessaires au projet. Nous pensons qu'il est possible de résoudre les problèmes de dispersion des outils en proposant une application générique multi-outils. Nous pourrons l'expérimenter dans le cadre du projet UNL.
Domaines
Informatique et langage [cs.CL]
Origine : Fichiers produits par l'(les) auteur(s)