Informatisation de dictionnaires langues africaines-français

Résumé : Cet article présente des travaux réalisés dans le cadre du projet DiLAF qui vise à informatiser des dictionnaires langues africaines-français (bambara, haoussa, kanouri, tamajaq, songhai-zarma) afin de pouvoir les diffuser plus largement et étendre leur couverture. Nous présentons une méthodologie de récupération de dictionnaires au format .doc et leur conversion dans un format XML structuré suivant les standards du domaine comme Unicode et Lexical Markup Framework. Cette méthodologie se veut simple et compréhensible par un linguiste sachant manipuler les expressions régulières. Les outils nécessaires sont gratuits, en source ouverte et multi-plate-formes. La méthode décrite est suffisamment générique pour être appliquée sur des dictionnaires d'autres langues, voire toute ressource textuelle.
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-00780181
Contributor : Chantal Enguehard <>
Submitted on : Wednesday, January 23, 2013 - 5:29:09 PM
Last modification on : Monday, February 11, 2019 - 4:36:02 PM
Document(s) archivé(s) le : Wednesday, April 24, 2013 - 3:55:25 AM

File

LTT2011_Mangeot_v2.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-00780181, version 1

Citation

Mathieu Mangeot, Chantal Enguehard. Informatisation de dictionnaires langues africaines-français. journées LTT 2011, Sep 2011, Villetaneuse, France. 11 p. ⟨hal-00780181⟩

Share

Metrics

Record views

263

Files downloads

818