Expériences et recommandations pour la gestion de corpus de parole pathologique - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2017

Expériences et recommandations pour la gestion de corpus de parole pathologique

Alain Ghio
Gilles Pouchoulin
François Viallet
  • Fonction : Auteur
  • PersonId : 846627
Antoine Giovanni
  • Fonction : Auteur
  • PersonId : 850064

Résumé

Actuellement, l'étude des dysfonctionnements de la voix et de la parole est sortie du simple cadre de la recherche clinique et intéresse les laboratoires de recherche issus des sciences du langage ou du traitement automatique de la parole. Par l'observation des dysfonctionnements, les chercheurs non cliniciens confrontent les résultats de leur recherche établis sur des corpus de parole "normale" à des situations de dysfonctionnement. Le défi est immense car le cadre "pathologique" induit une variation considérable dans ses manifestations de surface, c’est-à-dire sur les productions sonores. Aux symptômes de la maladie se superposent les effets variables des traitements mais aussi des phénomènes de compensation non uniformes des locuteurs. De ce fait, toute généralisation à une population clinique particulière nécessite l’observation d’un grand nombre de patients du fait de la très forte variation interindividuelle rencontrée. Il est donc important de mutualiser les enregistrements existants. Or pour être utilisables, ces enregistrements doivent répondre à de fortes exigences. Si les problèmes de prise de son ou autres signaux physiologiques sont en passe de devenir anecdotiques grâce à la diffusion de matériels de qualité et à la meilleure formation des personnels en charge des enregistrements, si le stockage des signaux de parole ne constitue plus actuellement un obstacle, si le recours à du matériau linguistique suffisant se généralise, le maillon faible reste la normalisation et la structuration des données sur les locuteurs et leurs productions langagières. Concrètement, si les données sonores sont souvent accessibles, elles ne présentent au final aucun intérêt si les liens entre les enregistrements et les caractéristiques cliniques du locuteur sont rompus ou erronés. L’objectif de ce travail est de présenter différentes actions de terrain et de proposer des recommandations pour la structuration des données sonores, physiologiques et cliniques (Ghio et al., 2012). La base de données SPEEDI-DB (Speech Disorders Database) propose un cadre opérationnel pour stocker, archiver et partager des données de parole pathologique. Contrairement aux bases de données orales de type patrimonial, dialogal, conversationnel, la parole pathologique nécessite la collecte et la mémorisation précise des informations sur les locuteurs et le contexte d’enregistrement. Par conséquent, nous préconisons de renseigner au maximum les informations sociolinguistiques mais aussi médicales, symptomatiques (ex : date d’apparition et localisation des symptômes), contextuelles (ex : « le patient a pris ses médicaments 4h auparavant »). De même, toute forme d’évaluation (ex : UPDRS pour les malades de Parkinson, GRBAS pour les dysphoniques) constitue une source d’information à conserver précieusement. A propos de la réalisation technique, la base de données de parole pathologique SPEEDI-DB est développée dans l'environnement PHP/MySQL sur un serveur Apache avec module sécurisé SSL (https://speedi-db.lpl-aix.fr/physio/). L’anonymisation des données ainsi que l’établissement de consentements éclairés auprès des locuteurs sont des aspects juridiques importants. Concernant l’accès aux données, il est indispensable de gérer des privilèges/rôles accordés aux demandeurs et ce, en fonction des producteurs de données (les hôpitaux). Un modèle de licence d’utilisation a été élaboré de façon à ne pas considérer les cliniciens comme de simples fournisseurs de patients mais au contraire, en les plaçant de façon active dans le processus de recherche. Seule un telle démarche permettra à terme de constituer de vastes corpus de parole "pathologique" multicentriques.
Fichier non déposé

Dates et versions

hal-01615035 , version 1 (11-10-2017)

Identifiants

  • HAL Id : hal-01615035 , version 1

Citer

Alain Ghio, Gilles Pouchoulin, François Viallet, Antoine Giovanni. Expériences et recommandations pour la gestion de corpus de parole pathologique. Corpus oraux, corpus écrits : pratiques croisées , 2017, Montpellier, France. ⟨hal-01615035⟩
109 Consultations
1 Téléchargements

Partager

Gmail Facebook X LinkedIn More