Le moteur de prédiction de mots de la Plateforme de Communication Alternative - Archive ouverte HAL Accéder directement au contenu
Article Dans Une Revue Revue TAL : traitement automatique des langues Année : 2007

Le moteur de prédiction de mots de la Plateforme de Communication Alternative

Résumé

We present the model of language implemented in the words prediction engine of the "Plateforme de Communication Aternative" (PCA), an assistive communication software designed for impaired persons. The model relies on a large coverage lexicon for french langage which provides for each entry its word frequency and its set of associated morphosyntactic categories. The engine includes a user model (personal lexicon for unknown words typed by the user, computation of personal word frequencies, storage of the generated sentences) and a morphosyntactic prediction system which weight the word frequencies of predicted words according to the syntactical context of the sentence.
The evaluation of the model of language is quite encouraging : a keystrokes saving rate of 55 % for 9 propositions. The major contribution comes from the raw prediction obtained by using the words frequencies of the general lexicon.
Nous présentons le modèle de langage sous-jacent au moteur de prédiction de mots de la Plateforme de Communication Alternative(PCA), un logiciel d'aide à la communication pour personnes handicapées.
Le moteur s'appuie sur un lexique général du français très couvrant qui donne pour chaque entrée la fréquence d'usage du mot et ses traits morphosyntaxiques associés. Il intègre un modèle utilisateur (lexique personnel mémorisant les mots inconnus saisis par l'utilisateur, calcul des fréquences d'usage propres, stockage des phrases produites) et un module de prédiction morphosyntaxique qui pondère les fréquences des mots prédits en fonction du contexte syntaxique de la phrase en cours de composition.
L'évaluation du modèle de langage donne des résultats satisfaisants, le taux d'économie de saisies est d'environ 55 % pour une liste de 9 propositions. La contribution dominante provient de la prédiction brute basée sur les fréquences d'usage du lexique général.
Fichier principal
Vignette du fichier
3264.pdf (321.21 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte

Dates et versions

hal-00285527 , version 1 (05-06-2008)

Identifiants

  • HAL Id : hal-00285527 , version 1

Citer

Philippe Blache, Stéphane Rauzy. Le moteur de prédiction de mots de la Plateforme de Communication Alternative. Revue TAL : traitement automatique des langues, 2007, 48 (2), pp.47-70. ⟨hal-00285527⟩
413 Consultations
705 Téléchargements

Partager

Gmail Facebook X LinkedIn More