Fast Development of Basic NLP Tools: Towards a Lexicon and a POS Tagger for Kurmanji Kurdish

Abstract : The development of basic NLP resources for minority languages is still a challenge to both formal and computational linguists. In this paper, we show how we were able to develop a medium-scale morphological lexicon for Kurmanji Kurdish in a few days time using only freely accessible resources. We also developed a preliminary POS tagger that shall be used as a pre-annotation tool for developing a POS-annotated corpus, based solely on raw text and on our morphological lexicon.
Type de document :
Communication dans un congrès
International Conference on Lexis and Grammar, Sep 2010, Belgrade, Serbia. pp.0, 2010
Liste complète des métadonnées

Littérature citée [26 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-00510999
Contributeur : Karën Fort <>
Soumis le : lundi 23 août 2010 - 11:40:54
Dernière modification le : vendredi 4 janvier 2019 - 17:33:24
Document(s) archivé(s) le : mardi 23 octobre 2012 - 12:35:18

Fichier

clg10kmr.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00510999, version 1

Collections

Citation

Géraldine Walther, Benoît Sagot, Karën Fort. Fast Development of Basic NLP Tools: Towards a Lexicon and a POS Tagger for Kurmanji Kurdish. International Conference on Lexis and Grammar, Sep 2010, Belgrade, Serbia. pp.0, 2010. 〈hal-00510999〉

Partager

Métriques

Consultations de la notice

547

Téléchargements de fichiers

380