Informatisation de dictionnaires langues africaines-français

Résumé : Cet article présente des travaux réalisés dans le cadre du projet DiLAF qui vise à informatiser des dictionnaires langues africaines-français (bambara, haoussa, kanouri, tamajaq, songhai-zarma) afin de pouvoir les diffuser plus largement et étendre leur couverture. Nous présentons une méthodologie de récupération de dictionnaires au format .doc et leur conversion dans un format XML structuré suivant les standards du domaine comme Unicode et Lexical Markup Framework. Cette méthodologie se veut simple et compréhensible par un linguiste sachant manipuler les expressions régulières. Les outils nécessaires sont gratuits, en source ouverte et multi-plate-formes. La méthode décrite est suffisamment générique pour être appliquée sur des dictionnaires d'autres langues, voire toute ressource textuelle.
Type de document :
Communication dans un congrès
journées LTT 2011, Sep 2011, Villetaneuse, France. 11 p., 2011
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-00780181
Contributeur : Chantal Enguehard <>
Soumis le : mercredi 23 janvier 2013 - 17:29:09
Dernière modification le : samedi 17 novembre 2018 - 08:42:03
Document(s) archivé(s) le : mercredi 24 avril 2013 - 03:55:25

Fichier

LTT2011_Mangeot_v2.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00780181, version 1

Citation

Mathieu Mangeot, Chantal Enguehard. Informatisation de dictionnaires langues africaines-français. journées LTT 2011, Sep 2011, Villetaneuse, France. 11 p., 2011. 〈hal-00780181〉

Partager

Métriques

Consultations de la notice

252

Téléchargements de fichiers

765