Achile : un dispositif de décodage acoustico-phonétique et d'identification lexicale indépendant du locuteur à partir de modules mixtes - Archive ouverte HAL Accéder directement au contenu
Thèse Année : 1997

Achile : a system based on parallel-distributed processes for speaker-independent acoustic-phonetic decoding and word recognition

Achile : un dispositif de décodage acoustico-phonétique et d'identification lexicale indépendant du locuteur à partir de modules mixtes

Alain Ghio

Résumé

The aim of Speech Recognition is to identify with machines what a speaker is saying. This process can recognise sounds (acoustic-phonetic decoding), words (isolated-words recognition) or sentences. Engineers can build such a system only for a specified user or for different speakers. ACHILE is a system based on parallel-distributed processes for speaker-independent acoustic-phonetic decoding and words recognition. This is a speaker-independent isolated-words recognition system without learning and adaptation stage. We aim to examine to what extent a knowledge-based model can recognise segmental structure without stochastic modelling. The system proposed is inspired, in a functional way, by some features of human cognitive processing. This system is composed of a succession of demons who work on the pattern, each performing a different job. The speech signal first arrives at the low level analysis processes. A part of this analysis is realised with a spectral detection based on a perceptual model including frequencies weighting and critical bands analysis. Low-level detectors activate parallel distributed processes of decoding (segmentation, global and analytic recognition). Their results, then, are sent to the high-level processes, who act upon them using high level information (phonological rules, access to a dictionary...). Finally, a decision process selects the alternative that has the strongest evidence. The system has been tested on 500 words. It allows us to quantify the relevance of knowledge, analysis and algorithms used. It is also possible to change or add some parts which is important to improve the system.
La reconnaissance de la parole est une activite dont le but est de faire identifier, par des machines, ce qui est dit par une personne. Le processus peut consister a reconnaitre des sons (decodage acoustico-phonetique), des mots (identification lexicale) ou des phrases. Un tel systeme est soit concu pour un seul utilisateur, soit pour differents locuteurs. Achile est un dispositif de decodage acoustico-phonetique et d'identification lexicle. Il permet la reconnaissance de mots isoles independamment du locuteur sans phase d'apprentissage, ni d'adaptation. Notre objectif est d'examiner jusqu'a quel point un modele a base de connaissances phonetiques est capable de decoder de facon automatique la structure phonique de la parole sans recourir aux methodes stochastiques. Le dispositif s'inspire, d'un point de vue fonctionnel, du traitement cognitif humain. La tache de reconnaissance est effectuee par repartition du travail et interaction d'une societe d'experts. Le signal de parole alimente tout d'abord les analyseurs de bas niveau. Pour cela, est utilisee, entre autre, une analyse spectrale fondee sur modele auditif qui tient compte de la notion de ponderation sonique et de bandes critiques. Les processus de bas-niveau transmettent leurs donnees a plusieurs modules de decodage fonctionnant en parallele (segmentation, reconnaissance globale et analytique). Les resultats sont ensuite transmis aux modules de haut-niveau qui agissent en utilisant des connaissances symboliques (representations phonologiques, acces lexical). Un moteur d'inferences se charge de prendre une decision finale en comparant les donnees d'un dictionnaire aux donnees decodees. L'evaluation du dispositif sur un lexique de 500 mots nous permet de quantifier la pertinence des connaissances, des analyses et des algorithmes employes. C'est aussi le moyen de pouvoir faire evoluer le dispositif en apportant des modifications.
Fichier principal
Vignette du fichier
These Alain Ghio.pdf (2.86 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

tel-01663493 , version 1 (08-01-2018)

Identifiants

  • HAL Id : tel-01663493 , version 1

Citer

Alain Ghio. Achile : un dispositif de décodage acoustico-phonétique et d'identification lexicale indépendant du locuteur à partir de modules mixtes. Traitement du signal et de l'image [eess.SP]. Université d'Aix Marseille, 1997. Français. ⟨NNT : ⟩. ⟨tel-01663493⟩
225 Consultations
534 Téléchargements

Partager

Gmail Facebook X LinkedIn More