Anonymisation de parole par quantification vectorielle - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2022

Privacy-Preserving Speech Representation Learning using Vector Quantization

Anonymisation de parole par quantification vectorielle

Résumé

With the popularity of virtual assistants (e.g., Siri, Alexa), the use of speech recognition is now becoming more and more widespread.However, speech signals contain a lot of sensitive information, such as the speaker's identity, which raises privacy concerns.The presented experiments show that the representations extracted by the deep layers of speech recognition networks contain speaker information.This paper aims to produce an anonymous representation while preserving speech recognition performance.To this end, we propose to use vector quantization to constrain the representation space and induce the network to suppress the speaker identity.The choice of the quantization dictionary size allows to configure the trade-off between utility (speech recognition) and privacy (speaker identity concealment).
L'utilisation de la reconnaissance de parole se répand de plus en plus dans les assistants virtuels.Cependant, les signaux de parole contiennent de nombreuses informations sensibles telles que l'identité du locuteur, ce qui soulève des préoccupations quant à la protection des données personnelles.Les expériences présentées montrent que les représentations extraites par les couches profondes des réseaux de reconnaissance de la parole contiennent cette information.Dans cet article, nous cherchons à produire une représentation anonyme tout en préservant les performances de reconnaissance de la parole.Dans ce but, nous proposons d'utiliser la quantification vectorielle pour contraindre l'espace de représentation, et inciter le réseau à supprimer l'identité du locuteur.Le choix de la taille du dictionnaire de quantification permet d'ajuster le compromis entre l'utilité (reconnaissance de la parole) et le respect de la vie privée (masquage de l'identité du locuteur).
Fichier principal
Vignette du fichier
main.pdf (419.24 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-03609205 , version 1 (15-03-2022)

Identifiants

Citer

Pierre Champion, Denis Jouvet, Anthony Larcher. Anonymisation de parole par quantification vectorielle. JEP 2022 - Journées d'Études sur la Parole, Jun 2022, Île de Noirmoutier, France. ⟨hal-03609205⟩
192 Consultations
125 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More