Enjeux méthodologiques, linguistiques et informatiques pour le traitement du français écrit des sourds - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2012

Enjeux méthodologiques, linguistiques et informatiques pour le traitement du français écrit des sourds

Tristan Vanrullen
  • Fonction : Auteur
  • PersonId : 839454
Leila Boutora
Jean Dagron
  • Fonction : Auteur

Résumé

Methodological, linguistic and computational challenges for processing written French of deaf people With the setup of a national emergency call-center for deaf people in France (CNRAU), some questions arise in linguistics and natural language processing about the written expression of deaf people. It is practiced by an heterogeneous population and shows morpho-syntactic, lexical and syntactic specificities which increase the difficulty, over the emergency situation, to successfully communicate between the deaf callers and the call-center operators. A first corpus (FAX-ESSU) of written French of deaf people was built with emergency conditions in order to provide linguistic and NLP solutions to the call center operators. On this corpus, we present a first study realized with the help of a natural language processing toolbox, in order to validation linguistic phenomenons described in the scientific literature and to enrich the knowledge of written French of deaf people.
L’ouverture du Centre National de Réception des Appels d’Urgence (CNRAU) accessible aux sourds et malentendants fait émerger des questions linguistiques qui portent sur le français écrit des sourds, et des questions informatiques dans le domaine du traitement automatique du langage naturel. Le français écrit des sourds, pratiqué par une population hétérogène, comporte des spécificités morpho-syntaxiques et morpho- lexicales qui peuvent rendre problématique la communication écrite entre les personnes sourdes appelantes et les agents du CNRAU. Un premier corpus de français écrit sourd élicité avec mise en situation d’urgence (FAX-ESSU) a été recueilli dans la perspective de proposer des solutions TAL et linguistiques aux agents du CNRAU dans le cadre de ces échanges écrits. Nous présentons une première étude lexicale, morphosyntaxique et syntaxique de ce corpus reposant en partie sur une chaîne de traitement automatique, afin de valider les phénomènes linguistiques décrits dans la littérature et d'enrichir la connaissance du français écrit des sourds.
Fichier principal
Vignette du fichier
taln2012_Vanrullen_Boutora_Dagron_article court-FINAL.pdf (422.15 Ko) Télécharger le fichier
TALN2012- Vanrullen-Boutora-Dagron_POSTER-final.pdf (1.18 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-01804890 , version 1 (05-06-2018)

Identifiants

  • HAL Id : hal-01804890 , version 1

Citer

Tristan Vanrullen, Leila Boutora, Jean Dagron. Enjeux méthodologiques, linguistiques et informatiques pour le traitement du français écrit des sourds. Actes de la conférence conjointe JEP-TALN-RECITAL, Jul 2012, Grenoble, France. pp.559-566. ⟨hal-01804890⟩
142 Consultations
81 Téléchargements

Partager

Gmail Facebook X LinkedIn More