IRCAM - Centre PompidouServeur © IRCAM - CENTRE POMPIDOU 1996-2005.
Tous droits réservés pour tous pays. All rights reserved.

Hauteur et timbre des sons

Jean-Claude Risset

Rapport Ircam 11/78, 1978
Copyright © Ircam - Centre Georges-Pompidou 1978


INTRODUCTION

La hauteur et le timbre sont deux attributs importants de la perception sonore : leur évolution dans le temps peut articuler un discours. La musique classique procède principalement par variation dans le temps de la hauteur, comme en témoigne la notation musicale ; dans le langage parlé, c'est la modulation temporelle du spectre sonore - dans une zone de 500 Hz à 3000 Hz environ - qui joue le plus grand rôle.

Dans cette présentation, je voudrais surtout insister sur le fait qu'au niveau même des attributs de hauteur et de timbre, et en dehors de contextes simplifiés, les choses sont moins simples qu'on ne le croit. Hauteur et timbre ne sont pas des paramètres physiques : ce sont des attributs de la perception. En donnant surtout des exemples dans le domaine musical, je parlerai de la relation de ces attributs à la structure physique objective des sons. Des techniques récentes d'analyse et de synthèse sonore, particulièrement à l'aide de l'ordinateur, ont permis de mieux cerner cette relation psychoacoustique, et je voudrais montrer qu'elle est plus complexe qu'on ne le pense généralement.

On définit généralement la hauteur comme la qualité qui fait distinguer un son grave d'un son aigu. On considère que la hauteur dépend de façon primordiale de la fréquence physique du signal sonore, et qu'on peut repérer la hauteur d'un son par la fréquence d'un son simple (sinusoïdal) donnant lieu à la même sensation de hauteur.

Il existe plusieurs définitions du timbre : on le définit parfois comme l'attribut qui permet de différencier deux sons de même hauteur et de même durée ; ou encore comme l'attribut qui permet de reconnaître l'origine du son - et en particulier de distinguer des sons émis par des instruments de musique différents. (Le mot timbre sert aussi à dénoter les différences de qualité sonore pour un instrument déterminé). On attribue généralement le timbre perçu à la complexité de la forme du son, soit encore au spectre en fréquence, c'est- à- dire au dosage d'harmoniques constituant la vibration sonore périodique.

On trouvera ces notions dans la plupart des ouvrages de physique(1) sous la rubrique "Acoustique : qualités physiologiques(2) des sons". Or, comme nous le verrons, ces notions sont tout-à-fait insuffisantes, de même que l'assimilation des sons musicaux aux sons périodiques.

HAUTEUR DES SONS

Variations avec l'intensité

Beaucoup de manuels sur l'audition, se fondant sur des résultats publiés en 1935 d'expériences portant sur un seul sujet(3), affirment que la hauteur d'un son simple de fréquence fixe varie beaucoup avec l'intensité du son. Des études plus récentes(4) viennent tempérer cette conclusion : la variation de hauteur perçue est en général faible, et son sens dépend du sujet. Il reste que cette variation de hauteur perçue pourrait être musicalement gênante : heureusement elle disparaît presque complètement dès que le son s'écarte d'une sinusoïde - par exemple, dès que la sinusoïde est modulée, même faiblement, en amplitude ou en fréquence. Donc, à l'exception des sons sinusoïdaux périodiques - qui dans plusieurs cas sont perçus d'une manière particulière très différente des conditions de la perception musicale(5) - l'effet de l'intensité sur la hauteur n'est pas très important.

Perception du "résidu"

Dans certaines conditions, un son complexe privé de sa composante fondamentale est perçu comme ayant la hauteur correspondant à la fréquence de cette composante fondamentale c'est-à-dire la même hauteur que s'il n'était pas privé de cette composante. On a longtemps cru que l'audition des fondamentaux physiquement absents, bien connue des facteurs d'orgue - et dont tirent parti les interlocuteurs téléphoniques, qui entendent des "résidus" sans le savoir - était due à la non-linéarité de l'oreille, reconstituant physiquement le fondamental à partir de ses harmoniques. Or la non-linéarité de l'oreille n'est sensible qu'aux fortes intensités, alors que le fondamental subjectif est perçu aux faibles intensités. Schouten (6) a étudié systématiquement la perception des "résidus", qu'il définit ainsi : le résidu est la perception globale d'un certain nombre de composantes de Fourier voisines comme un son de timbre aigu et de hauteur grave.

Par exemple, un son comportant des composantes sinusoïdales de fréquences 1800 Hz, 2000 Hz et 2200 Hz, est perçu comme ayant la même hauteur qu'un son sinusoïdal de fréquence 200 Hz. Cela n'est pas dû a la création physique, par non- linéarité de l'oreille, d'une vibration sinusoïdale de 200 Hz en effet, on ne peut obtenir des battements avec des sons de fréquence voisine de 200 Hz ; d'autre part, un bruit capable de masquer un son sinusoïdal de fréquence 200 Hz ne masque pas le résidu, qui continue d'être entendu avec la même hauteur sonore. De plus, si l'on déplace de 40 Hz toutes les composantes le long de l'axe des fréquences (les composantes de fréquences 1840 Hz, 2040 Hz et 2240 Hz, ne sont alors plus harmoniques), Le complexe est perçu comme ayant la même hauteur qu'un son sinusoïdal de fréquence 204 Hz. Il ne s'agit donc pas d'un son "différentiel" : la hauteur sonore perçue ne correspond pas à l'espacement des raies spectrales, comme certains auteurs l'avaient supposé.

Une explication cohérente du phénomène du résidu suppose un mécanisme assez complexe pour la perception des hauteurs(7) (8) . La membrane basilaire de l'oreille interne fonctionne comme un analyseur à large bande, dont La résolution correspond à la "bande critique", soit environ un tiers d'octave(9)cette analyse détermine le pouvoir de résolution de composantes sinusoïdales simultanées et la fusion ou la possibilité de discrimination de ces composantes - mais non la discrimination des hauteurs.

En aval de cette analyse, s'effectue dans chaque bande une détection de périodicité, et un mécanisme de décision prend en compte ces détections pour inférer une hauteur.

Le phénomène du résidu peut apparaître lorsque les composantes du son ne sont pas résolues par l'analyse cochléaire. Dans ce cas, l'information sur des hauteurs graves peut être transportée par des canaux nerveux qui correspondraient pour des sons purs à des fréquences élevées.

Les expériences sur le résidu ont permis de préciser les mécanismes de perception des hauteurs. Mais il faut noter que ces expériences ont été effectuées en faisant appel à quelques sujets entraînés : or, lorsqu'on présente des signaux formés (par exemple) de sinusoïdes de fréquences 1800, 2000 et 2200 Hz, à des auditeurs non avertis, nombreux seront ceux qui perçoivent une hauteur aiguë, et non un son de timbre aiguë et de hauteur grave. Même les sujets qui perçoivent la hauteur du résidu peuvent entendre dans le même son une hauteur aiguë - qui sera renforcé si l'on interrompt périodiquement le signal. On voit que la perception de la hauteur résulte d'un mécanisme de décision extrayant l'attribut de hauteur - suivant des modes pouvant varier - à partir des indices sensoriels. Ces indices sont liés de façon indirecte au signal sonore : la configuration spatio-temporelle de la membrane basilaire détermine des influx nerveux suivant des modalités complexes; ces influx peuvent être interprétés en termes de hauteur de façon variable. On voit apparaître dans cet exemple la notion de deux "hauteurs" correspondant à un même son périodique(12), notion que nous allons développer maintenant.

Paradoxes de hauteur

On peut dans certains cas distinguer une hauteur tonale - celle qui varie lorsqu'on passe d'un do à un ré - et une hauteur spectrale - celle qui varie lorsqu'on déplace une distribution de fréquences fixes. Cette distinction est particulièrement claire dans le cas de sons ne comprenant que des sons à intervalles d'octaves.

[Cf. ex. 1 à 9] Grâce à la synthèse des sons par ordinateur, nous pouvons séparer les variations de hauteur "tonale" et hauteur "spectrale" : pour des sons formés d'octaves, la hauteur tonale varie quand on fait varier la fréquence fondamentale, et la hauteur spectrale varie lorsqu'on déplace l'enveloppe spectrale. Cette dissociation peut conduire à des variations de hauteur paradoxales : sons donnant l'illusion de monter ou descendre sans fin - paradoxe similaire à l'escalier de Penrose (fig. 1) - (hauteur tonale fixe), et sons qui descendent la gamme tout en devenant plus aigus (hauteurs spectrale et tonale variant en sens inverse).(10) (11) La hauteur spectrale le long d'un axe linéaire (cf. figure 2) - la pertinence de cette représentation est confirmée par l'analyse factorielle de tests subjectifs effectués par Charbonneau.(13) (14)

On peut sur cette figure interpréter les paradoxes précédents. Nous avons étudié la manière dont des auditeurs - ayant des degrés divers d'éducation musicale percevaient hauteur tonale et hauteur spectrale. Nos observations indiquent que le concept de hauteur sonore n'est pas le même pour tout le monde. Un exemple est particulièrement frappant à cet égard.(11) Nous avons fait comparer la hauteur de deux sons b et B. b comporte des composantes de même amplitude et de fréquences 49, 102, 211, 435, 896, 1843, 3788; B est déduit de b en doublant toutes les fréquences composantes (B comporte donc 7 composantes de 98 à 7576 Hz). [Cf. ex. 11]On s'attendrait à ce que B soit entendu plus haut que b. Or certains auditeurs entendent B plus haut que b, mais une majorité entend B plus bas que b - alors que B est déduit de b en doublant ses fréquences!

Certains auditeurs déclarent que lorsqu'on passe de B à b, un son monte et un autre descend. En réalité, toutes les composantes montent, mais la hauteur spectrale monte et la hauteur tonale descend (d'environ un demi-ton)[Cf. ex. 12].

En étudiant les réponses à de tels stimuli, qui dissocient les variations de hauteur spectrale et de hauteur tonale, on parvient à obtenir de différents sujets des réponses contraires - quoique très affirmatives - sur le sens d'une variation de hauteur. Cela suggère que le concept de hauteur sonore varie d'un individu à un autre suivant le poids respectivement attaché à la hauteur brute et à la hauteur tonale. Parmi les auditeurs, certains étaient pratiquement sourds aux hauteurs tonales, et incapables de dire, en l'absence d'indices de timbre, si une gamme montait ou descendait : mais ils pouvaient déceler finement des variations spectrales semblant insignifiantes à d'autres auditeurs. Deux de ces auditeurs étaient passionnés de haute fidélité, ce qui à première vue peut sembler paradoxal, mais ce qui se comprend bien en seconde analyse, puisqu'ils ne pouvaient se satisfaire des hauteurs tonales, qu'on peut extraire même dans un signal distordu, et qu'ils étaient sensibilisés a l'aspect spectral et donc exigeants pour sa restitution fidèle. A l'autre extrême, certains sujets, excellents musiciens, appréciaient de façon dominante la hauteur tonale pour évaluer la hauteur dans des cas ambigus. La majorité des sujets formulaient des jugements intermédiaires entre ces deux cas extrêmes. Le concept de hauteur tonale était fermement constitué chez tous les musiciens; lorsqu'il était mal constitué, c'était chez des sujets sans pratique musicale. A l'appui de ces observations, des études(15) (16) montrent que la similarité entre octaves, fondement de la hauteur tonale, existe pour tous les sujets mais est renforcée par l'éducation musicale. Les musiciens apprécient de façon cohérente des relations de hauteur tonale, mais l'appréciation des hauteurs "spectrales" reste plus vague, même pour des sujets très éduqués : ainsi les erreurs d'octave sont fréquentes lorsqu'on compare les hauteurs de sons de spectres très différents. Il y a des sons périodiques dont la hauteur est ambiguë - et cette ambiguïté, qui empêche d'assigner à la note une octave définie, peut n'apparaître que dans une tâche de comparaison avec un son de spectre différent. Lorsqu'une même note est chantée par un ténor et une contralto, de nombreux auditeurs sont convaincus que ]e ténor chante une octave plus haut. En collaboration avec Charbonneau, nous avons fait une expérience établissant (avec des sons composés d'octaves) que les mélodies "tonales" sont mieux perçues par l'oreille droite et que les mélodies "spectrales" sont mieux perçues par l'oreille gauche(17). Ces résultats sont en accord avec des conclusions antérieures sur la dissymétrie des hémisphères cérébraux, les mélodies tonales paraissant se prêter davantage à une reconnaissance analytique que les mélodies spectrales(18). Il faut rapprocher cette donnée de l'important résultat de Bever et Chiarello(18), qui ont établi que les sujets sans éducation musicale perçoivent mieux les mélodies avec l'oreille gauche, mais qu'au cours de l'éducation musicale, l'oreille droite devient la meilleure.(19)

Hauteur et contexte

Même pour des cas simples, l'appréciation de la hauteur ne résulte pas d'une analyse passive: cette appréciation peut se faire selon des modes variables suivant la nature du signal mais aussi suivant l'état de l'individu et son "histoire". Un musicien estime des relations de hauteur : au cours de son éducation, il élabore (en général inconsciemment) des stratégies.La quantification des échelles de fréquence (gammes) et la représentation symbolique qui lui est liée lui permettent de pallier des incertitudes, et d'arriver à des jugements sûrs et reproductibles - mais fonction de son conditionnement. C'est ainsi qu'un occidental "naturalise" en termes de la gamme chromatique les intervalles d'un mode oriental construits suivant d'autres proportions(16). Cette opération est similaire à l'assimilation aux phonèmes connus. Autre phénomène quasi-linguistique, qui dépend du contexte musical et n'est pas susceptible d'une explication en termes exclusivement mathématiques ou physiques : les notes simultanées fa si impliquent la basse sol, et la résolution mi do par dilatation de l'intervalle augmenté fa si. Mais les mêmes notes (sur un piano), nommées fa do bémol, impliquent la basse ré bémol et la résolution sol bémol, par contraction de l'intervalle diminué fa do bémol. Suivant le contexte (et on peut passer mentalement d'un contexte à un autre comme d'une version à l'autre d'une figure ambiguë), la même stimulation physique pourra induire une stratégie ou une autre pour l'identification de l'intervalle. La différence entre si et do bémol n'est nullement extravagance de musicien, mais affirmation d'une fonction harmonique, qui a un sens très précis dans le langage tonal [Cf. ex. 13 à 14].

Hauteur et timbre

Les exemples que nous avons donnés plus haut concernant hauteur tonale et hauteur spectrale ont été réalisés avec des sons très artificiels et particuliers : la dichotomie du concept de hauteur sonore est loin d'être toujours aussi nette. Dans les sons qui ne comportent que des octaves, l'ambiguïté d'octave est poussée à son point extrême, et les variations de distribution spectrale correspondent incontestablement à une variation de hauteur. Mais si tous les harmoniques sont présents, ils créent une forte focalisation vers une hauteur unique (par exemple celle du résidu) qui est plus prégnante généralement qu'une hauteur spectrale résultant d'une distribution des composantes harmoniques suivant l'axe des fréquences: nous donnerions alors plutôt á cette hauteur spectrale le nom de timbre. W.Köhler(12) avait, dès 1915, distingué dans la sensation sonore deux aspects variant en fonction de la fréquence, et qu'il avait appelés respectivement "hauteur musicale" et "corps du son". Le "corps du son" est étroitement lié au timbre, alors que la hauteur musicale permet d'identifier des notes et des intervalles. Köhler indiquait aussi que les sujets non musiciens peuvent avoir une perception très imprécise de la hauteur musicale, mais qu'ils peuvent être très sensibles au "corps du son", aux aspects de timbre. La remarque suivante d'Arnold Schoenberg(20) est à peu près contemporaine de l'étude de Köhler(12)  : "Je ne peux guère admettre qu'il y ait une telle différence, comme on le dit habituellement, entre timbre et hauteur. Selon moi, le son est perceptible par son timbre, et l'une de ses dimensions est la hauteur". (...) La hauteur n'est autre chose que le timbre mesuré dans une direction". Cela correspond tout-à-fait à la conception que nous nous faisons de la hauteur pour un son périodique : les composantes forment une distribution, et la hauteur est une donnée extraite de l'aspect focalisé de cette distribution, le timbre correspondant à l'aspect distribué. Une étude de Plomp(21) confirme que pour les sons périodiques le timbre est corrélé à la distribution de l'excitation de la membrane basilaire (cette distribution, rappelons- le, fonctionne comme un analyseur de fréquence a large bande, et c'est à partir de détections de périodicité consécutives à cette analyse qu'est inférée la hauteur).

TIMBRE DES SONS

Problèmes de la conception classique du timbre

Ce que nous venons de dire confirme le point de vue classique sur le timbre, exposé dans l'introduction: pour des sons périodiques, le timbre dépend du spectre en fréquence. On sait que la modification de l'équilibre spectral altère le timbre et qu'on peut par exemple augmenter la "présence" du son en renforçant la région voisine de 2000 ou 3000 Hz. Pourtant réduire le timbre au spectre en fréquence (en réduisant le son musical au son périodique) conduit à de nombreuses difficultés.

Avant que la "haute fidélité" ne soit la règle, on pouvait identifier les instruments de musique dans les enregistrements, malgré d'importantes distorsions linéaires bouleversant les spectres. Le spectre d'un son est d'ailleurs facilement modifié, même lors d'une transmission aérienne. Ainsi les instruments de musique ont un rayonnement sonore anisotrope(22) : lorsqu'on tourne autour de l'instrument, le spectre entendu varie considérablement, mais cela n'affecte guère la reconnaissance auditive de l'instrument. Et la réponse en fréquence d'une salle réverbérante quelconque est très tourmentée et varie beaucoup lorsqu'on se déplace, même de quelques centimètres(23)les spectres sont donc extrêmement perturbés, sans que l'identification des sources sonores soit affectée.

[Cf. ex. 15] Il suffit de passer à l'envers une bande magnétique portant un enregistrement de piano pour modifier le timbre à tel point que l'instrument ne soit plus reconnaissable: or les spectres successifs sont restés les mêmes. Cette expérience simple indique l'importance des facteurs temporels pour le timbre - nous en donnerons d'autres exemples. Or ces facteurs temporels ont longtemps été méconnus. En effet, jusqu'à une époque récente, les appareils d'analyse sonore disponibles étaient très lents et ne pouvaient fournir pour un son qu'un spectre moyen, ou le spectre d'une période particulière (qu'on supposait se répéter identiquement à elle-même - la visualisation de quelques périodes successives faisant rarement apparaître de modification substantielle de la forme d'onde). Helmholtz(24) s'est rendu compte que "certaines particularités caractéristiques des sons de divers instruments dépendent de la façon dont ces sons débutent et se terminent; pourtant il a limité ses investigations aux particularités des sons musicaux indépendantes du temps, considérant qu'elles déterminaient la qualité musicale du son. La plupart des études ultérieures sur le timbre ont négligé l'aspect temporel du son. Toutefois les études de Stumpf(25)ont indiqué (voici plus de cinquante ans) l'importance des transitoires d'attaque pour la reconnaissance du son, mais les tentatives d'analyser les transitoires d'attaque de sons instrumentaux n'ont pas donné de résultats très significatifs. Les transitoires varient d'un son à un autre, même pour des sons auditivement semblables, et ce qui est significatif, c'est souvent toute l'évolution temporelle, pas seulement un transitoire initial précédant une phase stationnaire. On a tendu à généraliser hâtivement des conclusions particulières, ce qui a conduit à des contradictions qui ont jeté un certain discrédit sur les données acoustiques relatives au timbre: il a manqué à ces études une possibilité de synthèse pour vérifier et décanter les résultats des analyses.

Récemment sont apparus des moyens d'analyse plus adéquats, en particulier le sonagraphe, développé vers 1940 aux Bell Laboratories pour l'étude de la parole, et qui donne "un spectre évolutif", c'est-a-dire une analyse qui permet de suivre l'évolution temporelle du spectre. Le sonagraphe, qui donne du son une "photographie" capturant la plupart des détails significatifs, a permis de rendre compte de la raison d'être de certaines pratiques musicales qui paraissaient gratuites(26). Diverses modalités d'analyse ont pu être mises en oeuvre grâce à l'ordinateur. L'analyse du son démontre que les sons musicaux, loin d'être rigoureusement périodiques, sont souvent très complexes, elle met en évidence les variations au cours du son de certains paramètres, variations qui ne sont pas perçues comme telles, mais plutôt comme qualités distinctives, et elle permet d'énumérer nombre de particularités du son dont peut dépendre le timbre. Mais sans une vérification par synthèse cette énumération reste spéculative et elle ne donne pas la clé de ce qui caractérise certains timbres spécifiques.

Études sur le timbre faisant appel à la synthèse

La synthèse des sons par ordinateur(27)est très importante pour l'étude du timbre, car elle permet pour la première fois de produire des sons à la fois suffisamment complexes pour présenter un intérêt musical et parfaitement contrôlables dans tous leurs paramètres. La plupart des études psychoacoustiques antérieures étaient faites avec les seuls stimuli sonores qu'on pouvait contrôler précisément : sons sinusoïdaux, ondes carrées ou triangulaires, trains d'impulsion, bandes de bruit. Aussi la psychoacoustique musicale - étude de la relation entre paramètres physiques et aspects sensibles des sons musicaux - n'en est-elle qu'à ses débuts.

L'ordinateur permet ainsi de mettre en oeuvre une méthode significative d'étude du timbre d'un instrument de musique. On analyse d'abord des sons de l'instrument - en faisant éventuellement appel à l'ordinateur. De cette analyse on extrait une description physique des sons: à partir de cette description on synthétise des sons, qui doivent être auditivement très proches des sons initiaux dans la mesure où l'analyse a retenu les paramètres importants du timbre. Ensuite on peut faire varier individuellement chaque paramètre du son synthétisé pour évaluer sa pertinence auditive, ce qui permet, en laissant tomber les paramètres non pertinents, de simplifier la synthèse - car les résultats des analyses sont très complexes - et de définir des modèles ou en tout cas une caractérisation du timbre de l'instrument.

[Cf. ex. 16 à 18] Ainsi les sons synthétisés à partir de descriptions "classique" de sons de trompette ne rappellent en rien les cuivres, mais une étude suivant cette méthode(28) a permis d'isoler certaines particularités importantes, et en particulier une propriété qu'on peut considérer comme un modèle des sons cuivrés: le fait que la proportion d'harmoniques aigus du spectre s'enrichit avec l'intensité. Chowning(29) a pu utiliser sa technique de modulation de fréquence pour réaliser ce modèle de variation des spectres avec l'intensité et obtenir simplement des sons cuivrés. Morrill(30)a pu ajouter au réalisme des synthèses en y ajoutant des "accidents", des déviations de la fréquence par rapport aux valeurs "justes" - déviations qui sont souvent perçues en termes de timbre.

[Cf. ex. 19 à 23] L'étude de la trompette montre que le timbre cuivré peut se caractériser non par la valeur de tel ou tel paramètre, mais par une relation entre divers paramètres. Il semble que ce soit souvent le cas. Nous donnerons d'autres exemples, mais nous parlerons surtout ici de l'étude du timbre du violon réalisée par Mathews(31) et qui lui a permis de dégager un modèle du timbre des cordes frottées : ce timbre est lié à une courbe de réponse tourmentée de l'instrument, avec un rapport dynamique entre pics et vallées ni trop fort (ce qui donnerait des sons creux et inégaux) ni trop faible (ce qui donnerait des sons ternes). Une telle courbe de réponse provoque, en liaison avec le vibrato (modulation périodique lente de la fréquence) une modulation spectrale très complexe(32) qui est typique de la qualité du vibrato de violon - par opposition au vibrato "électronique" résultant de la seule modulation de fréquence d'un spectre invariable. Mathews a pu réaliser un violon électronique qu'on joue comme un violon, mais dont la caisse est remplacée par des circuits réglables - et qui peuvent être réglés de façon que l'instrument se rapproche de très près d'un violon classique, ou au contraire de façon à ce qu'il s'éloigne. C'est ainsi qu'en remplaçant le circuit qui met en oeuvre le modèle décrit ci-dessus par un autre réalisant la propriété caractéristique des sons cuivrés, on peut obtenir - avec un archet - des sons évoquant la trompette!

[Cf. ex. 24 à 26] On peut encore par synthèse attribuer certaines qualités subjectives du son à certaines structures physiques. Ainsi une légère inharmonicité peut donner un sentiment de chaleur. On peut suggérer une extension de la source sonore en introduisant un décalage de quelques dizaines de millisecondes entre deux signaux identiques émis par deux haut-parleurs espacés.

Timbre et ouïe

[Cf. ex. 27] Bien des aspects complexes et apparemment arbitraires de la perception du timbre sont mieux compris si l'on considère que l'évolution de l'ouïe a vraisemblablement tendu à tirer parti efficace des propriétés des sons pour fournir des informations utiles sur l'environnement. Mieux que la vue ou le toucher, l'ouïe joue un rôle d'alerte. On ne doit pas s'étonner que la perception auditive soit spécialement sensible aux modifications de l'environnement sonore, et qu'elle tende à éliminer de la conscience les sons stables ou permanents. Il est normal que l'audition ne se fie pas seulement à la structure d'un spectre pour évaluer le timbre et identifier l'origine du son, cette structure spectrale étant sévèrement distordue dans la propagation du son. La reconnaissance de la source sonore tire parti des paramètres résistant à la distorsion. Ainsi l'oreille est très sensible aux aspects fréquentiels, qui ne sont modifiés entre source sonore et auditeur que de façon exceptionnelle (par exemple par effet Döppler - mais l'oreille en tire alors des indices sur le mouvement des sources(33)). Au contraire, l'oreille est remarquablement insensible aux relations de phase entre les composantes d'un son complexe périodique, ce qui est heureux, puisque ces relations sont complètement brouillées dans un environnement réverbérant. En revanche l'audition tire parti de manière élaborée d'indices très fins pour distinguer un son lointain et intense d'un son proche peu intense mais de niveau physique comparable à l'endroit où se trouve le sujet. L'effet de précédence (Haas) aide l'auditeur à détecter la direction d'où vient le son, sans que cette détection soit perturbée par les premiers échos. Il est normal que l'attribut de timbre soit lié à des caractères spectraux ou temporels élaborés et résistant aux distorsions, de façon à préserver dans le "percept" auditif la "constance des choses réelles" (Koffka), ce qui est nécessaire pour que l'audition donne des indications utiles sur l'environnement.

La fonction auditive paraît constamment effectuer de véritables tests d'hypothèse sur le monde extérieur : ces tests, modelés par l'évolution phylogénétique et ontogénétique, sont bien sûr sans cesse confrontés aux données des autres canaux sensoriels avant que n'émerge une intégration(34) (35), une décision, une perception, une réponse. (Cf. également (36), (38) ).

L'espace des timbres

Dans l'audition musicale les fonctions d'alerte ou de reconnaissance des sources jouent pour ainsi dire a vide. Le timbre ne sert pas seulement à identifier la source sonore, à mettre sur le son une étiquette, mais il peut jouer en musique un rôle important. Cela nous ramène à Schoenherg, qui a tenté dans l'une des pièces pour orchestre Op. 16 une "mélodie de timbres" (Klangfarben-mélodie): loin d'être un élément accessoire ou décoratif pour une pensée musicale jouant principalement sur les hauteurs (comme dans l'Art de la fugue de Bach), le timbre devient ainsi un aspect essentiel de la construction musicale.

Depuis Schoenberg et Varèse, les compositeurs se préoccupent toujours davantage d'intervenir d'une manière compositionnelle - et non seulement décorative - dans l'élaboration de la structure même du son(42). Ligeti crée instrumentalement des polyphonies serrées, des tissages sonores qui composent des timbres.

[Cf. ex. 28 à 32] Dans une importante étude du timbre instrumental, Grey(39) a accompli à l'aide de l'ordinateur des interpolations entre sons de timbres différents - non pas fondus enchaînés, mais métamorphoses progressives d'un timbre à un autre. On voit s'ouvrir la possibilité de parcours continus dans l'espace des timbres, et la perspective de compositions élaborés de la micro-structure sonore - non content de composer avec des sons, on pourra composer le son lui-même. L'ordinateur permet un contrôle fin sur l'espace physique des sons. Mais il est utile d'explorer l'espace perceptif du timbre, pour dégager certaines dimensions suivant lesquelles s'articulent chez l'auditeur ressemblances ou relations de timbres. Les techniques d'analyse multidimensionnelle ont déjà été appliquées par Grey, Wessel(37) (et en France par Rodet) à l'exploration de l'espace perceptif des timbres. Sans doute subsistera-t-il toujours pour de telles études le problème du contexte musical : il reste que ces études permettront peut-être de dégager dans le timbre des dimensions des attributs - autres que la hauteur - pouvant se prêter à des mises en échelle, à des manipulations musicales plus élaborées et cohérentes, que le "timbre" au sens classique et global(40). On pourrait alors concevoir une musique fondée sur les opérations perceptives : elle pourrait mettre en scène des êtres sonores qui aient une véritable identité pour la perception, en ce sens qu'ils feraient jouer au plus profond nos facultés de reconnaissance et de découverte dans l'ordre du son. L'exploration de l'espace perceptif des timbres, et les études sur la caractérisation d'un timbre (qui relient un timbre à des structures de relation entre paramètres) nous font entrevoir comment on pourrait agencer ces êtres sonores qui pourraient être extrêmement prégnants : même s'ils ne correspondent à aucun "corps sonore", ils seraient profondément ancrés dans la perception. La commande de ces êtres sonores et de leurs transformations pourrait allier la préparation d'une écriture élaborée (démultipliée par des programmes) et la spontanéité du geste(41). Utopie sans doute, mais les moyens qui peuvent nous mener dans cette direction sont dès maintenant disponibles : les recherches dans ce sens devraient nous donner de l'univers sonore une nouvelle perspective - certainement en tout cas des conceptions de la hauteur et du timbre plus complexes que celles présentées au début de cet exposé.

RÉFÉRENCES

  1. - Cf. par exemple le célèbre et récent "Feynman Lectures in Physics", Addison Wesley, Reading, Mass. (1963) pp. 50- 63.

  2. - On se demande d'ailleurs pourquoi invoquer ici la physiologie, alors qu'il s'agit de notions relevant de la psychologie de la perception. Sans doute s'agit- il d'une conséquence de la ségrégation, traditionnelle en France, entre disciplines "scientifiques" (dont ferait partie la physiologie) et disciplines "littéraires" : la psychologie, rattachée aux disciplines littéraires, manquerait de crédibilité, comme toute étude de phénomènes "subjectifs". Faut- il rappeler qu'il est possible d'étudier - de manière scientifique et avec des résultats reproductibles - certains phénomènes subjectifs, en particulier dans le domaine de la perception ?, que la quête de critères "objectifs", pour un appareil de reproduction haute fidélité comme pour une transmission téléphonique, ne peut se fonder, en dernière analyse, que sur leur validité "subjective" ?, et qu'une étude "scientifique" de la musique ne peut sans se disqualifier omettre de tenir compte de ce bout de chaîne complexe mais essentiel qu'est l'auditeur ?

  3. - S.S. Stevens. The relation of pitch to intensity. J. Acoust. Soc. Am. 6 (1935) p. 150.

  4. - A. Cohen. Further investigations on the effects of intensity upon the pitch of pure tones. J. Acoust. Soc. 33 (1961) p. 1363.

  5. - Ainsi deux sinusoïdes de fréquences 132 Hz et 198 Hz (correspondant à do2 et sol2) fusionneront en un do1 : l'accord disparaît quand il est "juste"!

  6. - J.F. Schouten, R.J. Ritsma et B. Lopez- Cardozo. Pitch of the residue. J. Acoust. Soc. Am. 34 (1962) p. 1418.

  7. - J.C.R. Licklider. Auditory frequency analysis. In C. Cherry, Proc. 3d London Symposium on Inform. Th. Butterworth, London (1956) pp. 253- 268.

  8. - J.C. Risset. Sur certains aspects fonctionnels de l'audition. Ann. Télécomm. 23 (1968) pp. 91- 120.

  9. - R. Plomp. The car as a frequency analyzer. J. Acoust. Soc. Am. 36 (1964) pp. 1628- 1636.

  10. - R.N. Shepard. Circularity of judgements of relative pitch. J. Acoust. Soc. Am. 36 (1964) p. 2346.

  11. - J.C. Risset. Pitch control and pitch paradoxes demonstrated with computer synthesized sounds. J. Acoust. Soc. Am. 46 (1969) p. 88.

  12. - W. Köhler. Z. Psychol. 72 (1915)

  13. - G. Charbonneau et J.C. Risset. Circularité de jugements de hauteur sonore. C.R. Acad. Sci.Paris 227 Série B (1973) p. 623.

  14. - G. Charbonneau et J.C. Risset. Jugements relatifs de hauteur Schémas linéaires et hélicoïdaux. C.R. Acad. Sci. Paris 281 Série B (1975) p. 289.

  15. - D. Allen. Octave discriminability of musical and non-musical subjects. Psychon.Sci. 7 (1967) p. 421.

  16. - R. Francès. La perception de la musique. Vrin, Paris 1958.

  17. - G. Charbonneau et J.C. Risset. Différences entre oreille droite et oreille gauche pour la perception de la hauteur des sons. C.R. Acad. Sci. 281 Série B (1975) p. 163.

  18. - T. Bever et R.J. Chiarello. Cerebral dominance in musicians and non musicians. Science 185 (1974) p. 537

  19. - Chaque oreille est plus directement liée à l'hémisphère cérébral opposée. On notera que diverses expériences montrent que la décision de hauteur est inférée à un niveau cérébral où l'interaction binaurale peut , jouer un rôle : ainsi certains stimuli n'induisent une sensation de hauteur que s'ils sont présentés binauralement.

  20. - A. Schoenberg. Harmonielehre. Universal Ed., Vienne 1911.

  21. - R. Plomp. Pitch versus timbre. 7th ICA Congress, Budapest 1971

  22. - J. Meyer, Akustik der Holzblasinstrumente in Einzeldarstellung. Ed. Das Musikinstrument, Francfort, 1966

  23. - E.C. Wente. Characteristics of sound transmission in rooms. J. Acoust. Soc. Am. 7 (1935) p. 123.

  24. - H. Helmholtz. Sensations of tones (1877 ; traduction anglaise par E.J. Ellis). Dower, New-York 1954.

  25. - C. Stumpf. Die sprachlaute. Springer Verlag, Berlin 1926.

  26. - E. Leipp. Acoustique et musique. Masson, Paris 1971.

  27. - M.V. Mathews. The technology of computer music. M.I.T. Press, Cambridge, Mass. 1969.

  28. - J C. Risset et M V. Mathews; Analysis of instrument tones.Physics to day 22 n° 2, 23 (1969)

  29. - J.M. Chowning. The synthesis of complex audio spectra by means of frequency modulation. J. Audio Eng. Soc. 21 (1973) pp. 526- 534.

  30. - D. Morrill. Article à paraître au J. Audio Eng. Soc.

  31. - M.V. Mathews et J. Kohut. Electronic simulation of violin resonances. J. Acoust. Soc. Am. 53 (1973) pp. 1620- 1626.

  32. - Cette modulation est due au fait que certains harmoniques tombent sur une partie ascendante et d'autres sur une partie descendante de la courbe de réponse.

  33. - J.M. Chowning. The simulation of moving sound sources. J. Audio Eng. Soc. 19 (1971) pp. 2- 6.

  34. - J.C. Lafon. La reconnaissance phonétique et sa mesure. Ann. des Télécomm. 15 (1960) pp. 27- 37.

  35. - C. Cavé. Interactions perceptives entre l'audition et les autres modalités sensorielles. Conférences des Journées d'Etudes du Festival du Son, Ed. Radio, 1978.

  36. - J. Mehler, M. Barrière, D. Jassik- Gerschewfeld. La reconnaissance de la voix maternelle par le nourrisson. La Recherche 70 (1976) pp. 786- 788.

  37. - D. L. Wessel. Low dimensional control of musical timbre. Preprint, 1337, 59th Convention of the Audio Engineering Society, Hambourg 1978.

  38. - H. McGurk et J. McDonald. Hearing lips and seeing voices. Nature (1976) 264 pp. 746- 748.

  39. - J.M. Grey. An exploration of musical timbre. Ph. D. Thesis, Stanford Uty, 1975.

  40. - Le paramètre "timbre" n'a pas donné lieu jusqu'ici à des systèmes musicaux élaborés et cohérents comme le paramètre "hauteur". Il est vraisemblable que la hauteur restera à cet égard l'un des attributs privilégiés, l'audition humaine pouvant arriver pour cet attribut à des possibilités de différentiations raffinées : cependant ces possibilités peuvent aussi ne pas se développer si elles ne sont pas mises en pratique. Cf. Tanner W.P. et Rivette C.L. - Expérimental study of tone deafness. J. Acoust. Soc. Am., 36, 1964, pp. 1467.

  41. - Cf. à ce sujet les recherches de Mathews et Moore (Groove - a program to compose, store and edit functions of time - Communic. of the ACM 13 (1970) 715- 721) ; Allouis et Durr (Cahiers Recherche Musique : 3, Synthétiseur Ordinateur, INA - GRM 1976) ; Cadoz et Florens (Revue d'Acoustique, Juin 1978).

  42. - R. Erickson - Sound structure in music. Uty of Ca. Press, Los Angeles, 1975.

____________________________
Server © IRCAM-CGP, 1996-2008 - file updated on .

____________________________
Serveur © IRCAM-CGP, 1996-2008 - document mis à jour le .