Identification de HRTFs individuelles par selfies binauraux et apprentissage machine - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2022

Identification de HRTFs individuelles par selfies binauraux et apprentissage machine

Résumé

L’audition est une modalité essentielle pour appréhender notre environnement spatial et joue un rôle clef pour les applications de Réalité Augmentée. En particulier, l’incrustation dans le monde réel de l’auditeur, d’événements sonores synthétiques est un facteur déterminant pour les sensations de présence et d’immersion. L’intégration cohérente d’objets sonores virtuels dans la scène réelle représente cependant un défi et requiert l’adaptation des paramètres de spatialisation en fonction des propriétés acoustiques de l’environnement réel. La disponibilité de périphériques mobiles (ex. téléphones portables) suggère la recherche de méthodes capables d'identifier en permanence l’environnement acoustique dans lequel l’auditeur évolue. Dans cette étude, on s’intéresse plus particulièrement à l’estimation en aveugle des HRTFs de l’auditeur. Ces filtres, spécifiques à chaque individu, sont essentiels à la qualité de restitution spatiale sur casque d’écoute, mais requièrent traditionnellement un protocole de mesure complexe en conditions anéchoïques (signaux calibrés, repérage spatial, etc.). L’approche alternative proposée repose sur l’exploitation de méthodes d’apprentissage machine appliquées à l’analyse de selfies binauraux, c.à.d. des signaux captés par l’auditeur dans un environnement sonore quelconque grâce à des microphones auriculaires. Les modèles sont préalablement entraînés sur des scènes sonores synthétisées avec différents jeux d’HRTFs disponibles dans des bases de données. La littérature fournit des méthodes capables d’estimer la direction d’incidence d’une source sonore dans un signal binaural. L’accent est cependant mis ici sur l’estimation des HRTFs de l’auditeur. Lors de l’injection d’un nouveau selfie binaural, le modèle détermine le sujet de la base de données dont les caractéristiques binaurales sont les plus proches. La mobilité de l’auditeur est un atout pour accumuler des connaissances sur ces caractéristiques via l’analyse des trajectoires prédites. Les performances de différentes architectures sont comparées selon le poids accordé à cette analyse et en fonction de la qualité des signaux disponibles (stationnarité de la source, parcimonie fréquentielle, rapport signal/bruit ou direct/réverbéré).
Fichier non déposé

Dates et versions

hal-03848166 , version 1 (10-11-2022)

Identifiants

  • HAL Id : hal-03848166 , version 1

Citer

Anatole Moreau, Olivier Warusfel. Identification de HRTFs individuelles par selfies binauraux et apprentissage machine. 16ème Congrès Français d'Acoustique, CFA2022, Société Française d'Acoustique; Laboratoire de Mécanique et d'Acoustique, Apr 2022, Marseille, France. ⟨hal-03848166⟩

Collections

IRCAM
12 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More