Génération modulaire de grammaires formelles

Résumé : Les travaux présentés dans cette thèse visent à faciliter le développement de ressources pour le traitement automatique des langues. Les ressources de ce type prennent des formes très diverses, en raison de l’existence de différents niveaux d’étude de la langue (syntaxe, morphologie, sémantique,. . . ) et de différents formalismes proposés pour la description des langues à chacun de ces niveaux. Les formalismes faisant intervenir différents types de structures, un unique langage de description n’est pas suffisant : il est nécessaire pour chaque formalisme de créer un langage dédié (ou DSL), et d’implémenter un nouvel outil utilisant ce langage, ce qui est une tâche longue et complexe. Pour cette raison, nous proposons dans cette thèse une méthode pour assembler modulairement, et adapter, des cadres de développement spécifiques à des tâches de génération de ressources langagières. Les cadres de développement créés sont construits autour des concepts fondamentaux de l’approche XMG (eXtensible MetaGrammar), à savoir disposer d’un langage de description permettant la définition modulaire d’abstractions sur des structures linguistiques, ainsi que leur combinaison non-déterministe (c’est à dire au moyen des opérateurs logiques de conjonction et disjonction). La méthode se base sur l’assemblage d’un langage de description à partir de briques réutilisables, et d’après un fichier unique de spécification. L’intégralité de la chaîne de traitement pour le DSL ainsi défini est assemblée automatiquement d’après cette même spécification. Nous avons dans un premier temps validé cette approche en recréant l’outil XMG à partir de briques élémentaires. Des collaborations avec des linguistes nous ont également amené à assembler des compilateurs permettant la description de la morphologie de l’Ikota (langue bantoue) et de la sémantique (au moyen de la théorie des frames).
Type de document :
Thèse
Ordinateur et société [cs.CY]. Université d'Orléans, 2014. Français. 〈NNT : 2014ORLE2048〉
Liste complète des métadonnées

Littérature citée [114 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-01163150
Contributeur : Abes Star <>
Soumis le : lundi 21 septembre 2015 - 15:02:05
Dernière modification le : jeudi 17 janvier 2019 - 15:10:02
Document(s) archivé(s) le : mercredi 26 avril 2017 - 18:49:53

Fichier

simon-petitjean_3697.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01163150, version 2

Citation

Simon Petitjean. Génération modulaire de grammaires formelles. Ordinateur et société [cs.CY]. Université d'Orléans, 2014. Français. 〈NNT : 2014ORLE2048〉. 〈tel-01163150v2〉

Partager

Métriques

Consultations de la notice

252

Téléchargements de fichiers

258