Approche Statistique pour l’Analyse Objective et la Caractérisation de la Voix Dysphonique - Archive ouverte HAL Accéder directement au contenu
Thèse Année : 2008

Statistical Approach for Objective Analysis and Characterization of the Dysphonic Voice

Approche Statistique pour l’Analyse Objective et la Caractérisation de la Voix Dysphonique

Gilles Pouchoulin

Résumé

In our society where verbal communication is essential, the assessment of the quality of the pathological voice and the causes of its degradation occupies an increasingly important place for the medical corps. A person with a temporary or long-lasting voice disorder such as dysphonia can suffer serious consequences in their social relationships, both professional and personal: lack of effectiveness in communication, work stoppage or loss, social exclusion, even loss of identity. However, faced with the limitations of ear judgement (perceptual analysis) of voice dysfunction, voice therapists feel an increasing need for a method of objective evaluation of pathological voice quality, complementary to Perceptual analysis. This thesis falls within this framework and more precisely within the adaptation of Automatic Speaker Recognition (ASR) techniques to the automatic classification of dysphonic voices according to the global grade of the GRBAS perceptual scale. All studies are conducted on a corpus of 80 dysphonic voices (including 20 control voices) provided by the ENT department of the Centre Hospitalier et Universitaire de La Timone (Marseille). The aim of the work presented here is to gain a better understanding of the acoustic phenomena related to dysphonia. The originality of such an approach lies in the use of an automatic classification system as a tool for the characterization of pathological phenomena in the speech signal in order to provide human experts with new knowledge on voice alterations. In this sense, voice specialists such as phoneticians will be able to validate and / or enrich this new knowledge by deepening it. Where appropriate, the experts will in turn be able to suggest indications / guidelines to enable the automated system to explore new avenues of investigation. This approach differs from the methodologies proposed in the literature, which are more aimed at improving the performance of the system for the targeted task. The work carried out in this thesis is subdivided into two parts: a first part which describes the automatic system adapted to the pathological context and a second part which focuses on the search for the relevant information. With this in mind, three lines of research are proposed.
Dans notre société où la communication verbale est essentielle, l’évaluation de la qualité de la voix pathologique et des causes de sa dégradation occupent une place de plus en plus importante pour le corps médical. Une personne atteinte d’un trouble vocal momentané ou durable comme une dysphonie peut subir de graves conséquences dans ses relations sociales, tant sur le plan professionnel que personnel : manque d’efficacité dans la communication, arrêt ou perte du travail, exclusion sociale, voire perte identitaire. Cependant, face aux limites du jugement à l’oreille (analyse perceptive) du dysfonctionnement vocal, les thérapeutes de la voix ressentent le besoin de plus en plus pressant d’une méthode d’évaluation objective de la qualité de la voix pathologique, complémentaire à l’analyse perceptive. Cette thèse s’inscrit dans ce cadre et plus précisément dans l’adaptation des techniques de Reconnaissance Automatique du Locuteur (RAL) à la classification automatique des voix dysphoniques suivant le grade global de l’échelle perceptive GRBAS. Toutes les études sont conduites sur un corpus de 80 voix dysphoniques (dont 20 voix de contrôle) fourni par le département ENT du Centre Hospitalier et Universitaire de La Timone (Marseille). L’objectif des travaux présentés ici est d’acquérir une meilleure compréhension des phénomènes acoustiques liés à la dysphonie. L’originalité d’une telle approche réside dans l’utilisation d’un système de classification automatique comme outil de caractérisation des phénomènes pathologiques dans le signal de parole afin d’apporter aux experts humains de nouvelles connaissances sur les altérations de la voix. En ce sens, les spécialistes de la voix comme les phonéticiens pourront valider et/ou enrichir ces nouvelles connaissances en les approfondissant. Le cas échéant, les experts pourront en retour suggérer des indications/directives permettant au système automatique d’explorer de nouvelles pistes d’investigation. Cette démarche se distingue des méthodologies proposées dans la littérature qui visent davantage à améliorer les performances du système pour la tâche visée. Les travaux réalisés dans cette thèse se subdivisent en deux volets : un premier volet qui décrit le système automatique adapté au contexte pathologique et un deuxième volet qui s’intéresse à la recherche de l’information pertinente. Dans cette optique, trois axes de recherche sont proposés.
Fichier principal
Vignette du fichier
thesis.pdf (4.46 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-01472450 , version 1 (20-02-2017)

Licence

Paternité - Pas d'utilisation commerciale - Partage selon les Conditions Initiales

Identifiants

  • HAL Id : tel-01472450 , version 1

Citer

Gilles Pouchoulin. Approche Statistique pour l’Analyse Objective et la Caractérisation de la Voix Dysphonique. Intelligence artificielle [cs.AI]. Université d'Avignon et des Pays de Vaucluse, 2008. Français. ⟨NNT : ⟩. ⟨tel-01472450⟩

Collections

UNIV-AVIGNON
367 Consultations
741 Téléchargements

Partager

Gmail Facebook X LinkedIn More