Résumé |
Les techniques de spatialisation des sons permettent de suggérer une source sonore provenant de toute incidence, et constituent à ce titre un facteur important d'immersion pour les systèmes de réalité virtuelle. Cette thèse se concentre sur l'une d'entre elles, la synthèse binaurale, pour une reproduction sur casque d'écoute. Cette technique a pour objectif de restituer aux tympans de l'auditeur le champ sonore qui aurait été engendré dans une situation d'écoute réelle, et est à ce titre une technique de simulation idéale. Toutefois, elle rencontre deux principaux freins pour un déploiement à grande échelle de qualité, thèmes qui ont constitué le moteur du présent travail. Il s'agit tout d'abord de son coût de calcul, exhorbitant au regard des autres techniques de spatialisation. Nous en avons envisagé l'optimisation pour la mise en espace simultanée de nombreuses sources sonores. En outre, les mécanismes perceptifs en jeu dans la synthèse binaurale pour "duper" l'oreille dépendent fortement de l'auditeur, et nous avons mis en place plusieurs stratégies pour permettre l'adaptation individuelle de ces traitements. Cette thèse aborde la synthèse binaurale sur des aspects théoriques et pratiques (relevés expérimentaux, implantation), et comprend la validation perceptive de plusieurs solutions proposées. Les résultats montrent que des formats binauraux multicanaux peuvent être définis sans perte de qualité de la reproduction par comparaison avec la structure bicanale traditionnelle, et permettent en outre d'optimiser le coût d'implantation dès que plus de quatre sources sont spatialisées. On constate que les différences inter-individuelles peuvent être réduites à différents niveaux de l'implantation : par l'égalisation appropriée des filtres de la synthèse, par l'utilisation d'un format multicanal à encodeur universel, ou par un traitement spécifique. Le lien avec les paramètres morphologiques de l'auditeur ouvre la possibilité d'une adaptation individuelle automatique, donc très souple, s'appuyant par exemple sur la saisie vidéo des caractéristiques de la tête, du torse et des pavillons. |