IRCAM - Centre PompidouServeur © IRCAM - CENTRE POMPIDOU 1996-2005.
Tous droits réservés pour tous pays. All rights reserved.

Introduction à la cognition auditive.

Stephen McAdams, Emmanuel Bigand

Penser les Sons: Psychologie Cognitive de l'Audition, Oxford University Press, Oxford 1993
Copyright © Oxford University Press 1993


(English Version)

L'esprit voit et écoute, le reste est aveugle et sourd
Epicharmus 45O B.C.E.
[citation de Coren & Ward (1989)]

Préface

A notre connaissance aucun ouvrage didactique ne présente en langues anglaise et française l'ensemble des aspects cognitifs de l'audition humaine. C'est pour remédier à cela qu'un séminaire de travail fut organiser par le groupe Audition de la Société Française d'Acoustique. Des spécialistes des différents domaines de la perception et de la cognition auditive y furent invités et présentent dans les chapitres de cet ouvrage les études réalisées dans leur domaine de recherches spécifiques.

L'audition révèle un paradoxe similaire à celui rencontré dans tous les domaines de la perception : rien ne semble plus simple que de percevoir les sons de notre environnement et pourtant il s'agit là d'un phénomène particulièrement récalcitrant à l'analyse scientifique. Quelle difficulté par exemple à reconnaitre son nom dans une conversation, à différencier le bruit d'une voiture de celui d'un avion à hélice, à percevoir le rythme entrainant d'un rock de Bill Haley, à reconnaitre la voix de son enfant ou les bruits de pas d'une personne familière ? Il semble suffisant d'ouvrir grand ses oreilles pour cela.

Imaginez cependant un seul instant, la quantité d'information et le nombre de procédures qu'il serait nécessaire de donner à un ordinateur pour le rendre capable de distinguer un violon d'une flûte dans une polyphonie, de detecter un signal d'alarme dans le bruit de fond environnant, de saisir une relation entre un thème et ses variations, de repérer une anomalie de moteur à la seule écoute du bruit d'une voiture, de detecter un bruit inhabituel dans les battements de coeur d'un patient etc.. Malgré le très haut degré de sophistication technologique actuel, il est fort probable que ce type de question ne pourra être résolu qu'après de nombreuses années d'études en intelligence artificielle et en traitement du signal, tant la quantité d'informations nécessaire est grande et la façon dont elle doit être combinée complexe.

Cette difficulté à analyser les processus d'écoute souligne la grande richesse de l'information présente dans le monde sonore qui nous entoure. L'objectif principal de ce livre est de rendre compte de notre connaissance actuelle des processus cognitifs qui traitent cette information chez l'homme. Il s'adresse principalement aux étudiants en sciences cognitives et aux scientifiques spécialisés dans d'autres domaines que la psychologie de l'audition. Une connaissance élémentaire des termes usuels en acoustique, des concepts et des méthodes habituels en psychologie expérimentale est cependant nécessaire.

Référence

Coren,S. and Ward, L.M. (1989). Sensation and perception, 3rd Ed. Harcourt,
Brace, Jovanovich, San Diego.

Remerciements

Cet ouvrage collectif fait suite au quatrième atelier didactique organisé par le groupe Audition de la Société Française d'Acoustique (S.F.A). Les trois précédents ateliers ont porté sur la physiologie de la cochlée (Aran, Dancer, Dolmazon, Pujol & Tran Ba Huy 1988), la psychoacoustique et la perception auditive (Botte, Canévet, Demany & Sorin 1989) et le système nerveux auditif central (Roman, in press). L'organisation de cet atelier et la préparation de ce livre ont été possibles grâce à l'aide financière et à l'infra structure des organismes suivants :

Cet atelier didactique fut conçu et animé avec vigueur depuis plusieurs années par la présidente du groupe Audition et vice présidente de la S.F.A. : Marie-Claire Botte . C'est grâce à ses efforts soutenus que le statut de la recherche française sur l'audition a suivi une évolution remarquable ces dernières années. C'est donc avec une grande reconnaissance et un profond respect que nous lui dédicaçons ce livre.

Les chapitres de cet ouvrage ont été soumis à un comité de lecture, chacun ayant été critiqué par deux à quatre spécialistes et par les éditeurs (chaque co-éditeur assurant la critique du chapitre de l'autre). Nous souhaitons particulièrement remercier tous les auteurs pour leur coopération lors de cette tâche ardue ainsi que les auteurs suivant pour leur critique : Alain Lieury, Brian Moore, Bruno Repp, Charles Watson, Christopher Darwin, Earl Schubert, Eric Clarke, Francis Eustache, Jay Dowling, Jean-François Camus, Jose Morais, Josiane Bertoncini, Karen Yankelovich, Ken Robinson, Rachel Clifton, Robert Zatorre, Stanislas Dehaene, Stephen Handel et trois auteurs supplémentaires. Nous remercions également Cécile Marin pour la préparation du thème de ces journées et la réalisation de l'index, Carolyn Drake et les auteurs pour leur aide lors de la préparation du glossaire

Ce livre est également publié en Anglais sous le titre "Thinking in Sound : Cognitive Perspectives on Human Audition" par Oxford University Press .

S.M. & E.B.

Paris, 8 Février 1992

Introduction à la cognition auditive

Quels sont les aspects cognitifs dans l'audition ?

L'etymologie du terme cognitif renvoiet à la notion de connaissance. Ce terme a ensuite été utilisé dans un sens plus précis pour désigner les conditions qui permettent l'acquisition et le développement d'une connaissance du monde. Il va sans dire que la perception joue un rôle essentiel à ce niveau : aucune théorie de la connaissance ne serait ainsi complète sans une théorie de son acquisition et donc de la perception. L'étude des aspects cognitifs de l'audition a pour objectif de comprendre comment l'information auditive contribue fondamentalement au développement de la connaissance.

Bien sûr, les processus de traitement de l'information auditive dont il sera question ici pourront sembler très différents de ceux intervenant dans des activités intellectuelles plus abstraites telles que la pensée, la logique, le raisonnement, la prise de décision, l'imagination etc.. Deux remarques doivent cependant être faites sur ce point. Tout d'abord l'originalité du projet cognitiviste est de présenter une vision intégrée de l'ensemble des processus intellectuels en mettant en évidence la continuité existant entre les aspects les plus élémentaires de ces activités (traitement de l'information sensorielle) et les aspects les plus abstraits (traitement de l'information symbolique). Par conséquent, le projet cognitiviste dépasse la traditionnelle division en fonctions intellectuelles indépendantes : perception, mémoire, apprentissage, langage, intelligence etc. Envisager des aspects cognitifs dans l'audition, c'est vouloir situer les processus de perception auditive à l'intérieur de cette continuité.

La seconde remarque concerne plus directement la nature des processus mentaux impliqués dans la perception auditive. L'importance accordée au terme cognitif dans cet ouvrage signifie que par delà les phases élémentaires de traitement, des processus de traitement de haut niveau (représentations mentales, prise de décision, inférence, interprétation) semblent indispensables au système auditif pour élaborer une représentation cohérente du monde sonore. En effet, le postulat de base d'une approche cognitive de l'audition est que l'information sensorielle doit être interprétée pour donner naissance à une perception cohérente. Cette interprétation est nécessaire puisque l'information contenue dans les stimuli qui atteignent les organes sensoriels se révèle souvent incomplète ou ambiguës. Dans ces cas, le système perceptif doit représenter puis comparer des informations qui ne sont plus directement disponibles au niveau sensoriel.

Ceci est d'autant plus frappant dans le cas de l'audition, puisque les événements sonores se succèdent dans le temps : l'élaboration d'une représentation mentale s'avère indispensable pour percevoir leur structure, c'est à dire pour établir des relations entre des événements séparés par plusieurs minutes ou même plusieurs heures. La musique est une structure sonore exemplaire de ce point de vue : comment percevoir l'unité d'un ensemble de sons qui se développe sur de très longs laps de temps (une heure et demi dans le cas de la 9ème symphonie de Beethoven) sans élaborer une représentation des sous-structures (thématiques par exemple) qui sont développées dans l'oeuvre ?

Lorsque l'information immédiatement disponible au niveau sensoriel se révèle insuffisante, le système perceptif analyse la situation en considérant la connaissance acquise sur le monde sonore. A l'exception du nouveau né, l'information de l'environnement ne parvient pas dans un organisme complètement naïf. Les connaissances interagissent avec les données sensorielles actuelles dans l'interprétation des stimulations auditives. Imaginez vous un instant en pleine forêt amazonienne : vous entendriez exactement les mêmes bruits que le guide qui vous accompagne mais, étant donné votre manque de connaissance du milieu, vous seriez incapable d'extraire du fond sonore les sons correspondant aux cris de l'iguane, aux singes macaques, aux chants des ouistitis ou aux bruissements des arbres tropicaux. De ce fait, vous seriez dans l'incapacité d'attribuer une signification à l'ensemble de la structure sonore, ce qui pourrait être important pour votre survie dans l'environnement. De la même façon, les oreilles d'or de la marine française qui ont été entraînée à la détection de sonar, parviennent à percevoir et à identifier des sources sonores comme des "clicking shrimp", des baleines, "porpoises", des bancs de poissons, le flux des océans.??(ocean-going vessels) là où la plupart d'entre nous n'entendrait qu'un ensemble indifférencié de bruits sous marins. Ils réussissent même à distinguer les bruits de bateaux de commerce et de bateaux militaires, des bruits de sous marins en surface ou en plongée, propulsés par un moteur nucléaire ou un moteur diesel, voire même jusqu' à la nationalité russe, américaine ou française du sous-marin . Dans les cas les plus dramatiques, l'incapacité à différencier les sources sonores et à identifier leur origine peut aboutir à ne pas déduire de ces signaux la présence d'un danger imminent : la présence d'un jaguar dans le premier exemple ou celle d'un sous-marin clandestin par exemple.

Dans le cas de structures sonores telles que la musique, dont l'organisation est hautement déterminée par des règles culturelles, une simple observation de l'information enregistrée au niveau sensoriel ne suffit pas à expliquer les très grandes différences perçues lorsque l'on passe d'un quatuor de Mozart à un quatuor de Beethoven par exemple.

Dans bien d'autres situations, l'information disponible au niveau sensoriel peut se révéler trop ambiguë pour donner lieu à une perception univoque de la situation. Imaginez vous par exemple la nuit dans un vieux manoir isolé dans la campagne : les bruits perçus résultent ils des pas d'un cambrioleur cherchant à s'introduire dans la maison, ou s'agit il simplement des crissements du vent sur les vieux matériaux.? L'identification de la source sonore pourra être différente selon le type d'information privilégiée : régularité des bruits ou qualités timbrales des matériaux mis en vibration. Confronté à des stimuli ambigüs de ce type, le système perceptif prendra des décisions inconscientes pour organiser la figure sonore. La connaissance de l'auditeur peut jouer un rôle important à ce niveau : dans l'exemple précédent, un enfant, un adulte ou le propriétaire de la maison arriveraient sans doute à des interprétations différentes.

Les illusions auditives constituent une autre situation illustrant le travail d'interprétation réalisé par le système perceptif : dans ce cas, l'inférence effectuée sur la base des informations disponibles est incorrecte et conduit à la perception d'un objet sonore fictif. Les compositeurs ont su depuis plusieurs siècles exploiter ces caractéristiques de la perception pour créer des figures sonores séduisantes. Les sonates et partitas pour violon seul de J.-S. Bach offrent de nombreux cas remarquables d'illusion auditive : l'auditeur perçoit assez clairement la présence de deux violons jouant dans des registres différents bien qu'il n'y ait en fait qu'un seul violoniste jouant très rapidement des notes alternativement graves et aiguës. De la même façon, en jouant une même mélodie dans plusieurs familles d'instruments, Ravel dans le Boléro, réussit à détourner l'oreille de la perception d'un ensemble de timbres différents et à l'orienter vers la perception d'un timbre unique aux qualités chatoyantyes et nouvelles qui provient d'une source sonore virtuelle.

Etat actuel de la recherche sur la cognition auditive

Notre perception du monde sonore dépasse ainsi largement les qualités de l'information sensorielle disponible à chaque instant : elle résulte d'un traitement de l'information. L'étude des aspects cognitifs du traitement de l'information effectué dans différentes modalités sensorielles est actuellement en grand progrès dans les sciences cognitives. Dans le domaine visuel, les processus de traitement de haut niveau sont l'objet d'un très grand nombre d'articles et d'ouvrages. Marr (1982), Pinker (1984) and Humphreys & Bruce (1989) proposent une importante synthèse des concepts théoriques et des données expérimentales fondamentales dans ce domaine. Dans le cas de l'audition, l'étude des processus cognitifs a été abordé dans des publications concernant essentiellement la perception et la compréhension du langage. Dans l'ensemble ces ouvrages traitent habituellement des thèmes suivants :

Dans le domaine de l'audition non verbale, les ouvrages comparables (e.g. Moore 1982; Warren 1982; Botte, Canévet, Demany & Sorin 1989) concernent essentiellement les aspects physiologiques et psycho-acoustiques de l'audition. Les publications récentes de (1985), Dowling & Harwood (1986), Handel (1989), Dooling & Hulse (1989), and Bregman (1990), marquent cependant un tournant important puisque l'audition y est abordée dans des situations d'écoutes et avec des stimulis sonores très différents de ceux habituellement rencontrés dans les laboratoires de psycho acoustiques.

On constatera que le développement de la psychologie de la musique a fortement contribué à l'étude des processus cognitifs dans le domaine de l'audition non verbale. Depuis les 20 à 30 dernières années, la problématique dans ce domaine et les méthodes d'étude de ce qu'il est convenu d'appeler "l'esprit musicien" se sont particulièrement enrichies. La plupart des auditeurs possèdent et utilisent des processus perceptifs et cognitifs hautement sophistiqués pour comprendre, apprécier et participer aux activités musicales. Le fait que les systèmes musicaux observés dans toutes les cultures du monde aient atteint un degré de complexité structurelle (ou grammaticale) comparables à ceux rencontrés dans le langage et qu'ils puissent eux aussi être acquis sans apprentissage spécifique dès un très jeune âge est particulièrement intéressant pour les sciences cognitives. La place occupée par la psychologie de la musique dans la plupart des chapitres suivants témoigne de son importance pour la cognition auditive.

Un domaine reste cependant peu étudié chez l'adulte ; celui de l'intégration des processus cognitifs auditifs dans des processus intervenant dans d'autres modalités sensorielles ou dans des processus cognitifs généraux intervenant dans la vie quotidienne. L'utilisation des indices sonores pour se déplacer en toute sécurité dans l'environnement urbain, pour actionner et conduire des machines sophistiquées ou pour évaluer l'identité et la signification d'événements de l'environnement qui ne se trouvent pas actuellement dans le champs de vision sont des situations qui illustrent cette intégration. L'étude de ces situations montrera probablement que l'audition joue, dans la vie quotidienne, un rôle tout aussi important que la vision et le langage

Présentation de l'ouvrage

Il y a de nombreuses façons de subdiviser un domaine de recherche. Celle adoptée dans cet ouvrage comprend les différents domaines suivants, certains pouvant se chevaucher partiellement : organisation perceptive (Bregman), perception des caractéristiques globales des séquences acoustiques (Warren), processus attentionnels (Jones & Yee), mémoire (Crowder), reconnaissance (McAdams), neuropsychologie (Peretz), perception de la musique (Bigand) et psychologie du développement (Trehub & Trainor). Une représentation schématique des principaux processus auditifs étudiés dans cet ouvrage et de leur interaction est proposée dans la figure 1. Les vibrations sonores parvenant à l'oreille interne sont analysées et transformées en impulsions nerveuses qui progressent vers le cerveau par le nerf auditif. Ce processus de transduction est brièvement abordé par McAdams.

[Figure 1]

Les processus de groupement auditif effectuent la fusion et la ségrégation des éléments sonores simultanés en événement auditifs et organisent les événements successifs en flux auditifs. Ces processus interviennent quotidiennement dans différentes situations. Par exemple, si nous regardons la télévision et qu' une voiture klaxonne soudainement dans la rue, notre système perceptif parviendra sans aucune hésitation à interpréter ce nouveau bruit comme un objet sonore distinct se surimposant à ceux provenant au même moment de la télévision. Ces processus de groupement auditifs sont amplement présentés par Bregman, et sont partiellement discutés dans les chapitres de Warren, Jones & Yee, Bigand et Trehub & Trainor.

Conformément à la théorie de l'analyse des scènes auditives, le groupement auditif précéde généralement l'extraction ou le calcul des propriétés ou attributs perceptifs. Ces attributs constituent des propriétés perceptives qui sont dérivées des éléments qui ont été préalablement groupés. L'oeuvre musicale de Rimsky-Korsakovs intitulée "le vol du bourdon" permet d'illustrer la nature de ces processus : les notes s'y suivent à une vitesse si rapide qu'elles forment un flux sonore unique et ne peuvent pas être entendues séparément. L'auditeur perçoit essentiellement la forme globale de la ligne mélodique rythmée par ses pics et par les notes accentuées par le trompettiste. La perception globale de la structure et de l'organisation temporelle des séquences sonores est abordée dans les chapitres de Warren et Jones & Yee.

Une fois représentées dans le système perceptif, les qualités perceptives peuvent être interprétées en fonction des structures de connaissances abstraites évoquées. L'événement sonore ou la séquence d'événements est alors reconnu, identifié et reçoit une signification qui dépend du contexte et de l'expérience antérieure de l'auditeur. Imaginez vous en train de préparer le repas dans la cuisine. Tout d'un coup se produit un important vacarme dans le salon. L'analyse du bruit perçu vous permet d'identifier le bruit d'assiettes qui se brisent, le son des fourchettes et des cuillères rebondissant sur le carrelage, le son feutré du saladier s'écrasant sur le sol et au milieu de tout cela le miaulement plaintif du chat. L'identification de ces bruits vous permet alors de donner une signification à l'ensemble de la scène : le chat en jouant avec le coin de la nappe a fait tomber tout ce qui se trouvait sur la table. Les chapitres de Crowder, McAdams et Peretz présentent les processus psychologiques et neuropsychologiques impliqués dans l'identification des sources sonores, des sons, et des séquences de sons. Le chapitre de Crowder porte plus précisément sur les aspects spécifiques de l'audition impliqués dans la mémoire. La perception des relations entre les événements musicaux est elle aussi partiellement déterminée par les connaissances acquises par des auditeurs adultes au contact d'une culture musicale précise. La structure des connaissances musicales est abordée par Bigand dans le cadre de la musique occidentale tonale/métrique. L'existence chez le bébé d'aptitudes précoces permettant leur développement tout au long des travaux expérimentaux présentés par Trehub & Trainor et Peretz, elle, discute plusieurs cas de patients cérébro lésés chez qui l'accès à de telles structures est sérieusement altéré.

La perception des relations entre les événements sonores induit un cadre interprétatif général qui peut influencer la perception des événements ultérieurs. Ce cadre conditionne fortement l'élaboration de larges réseaux de relations structurelles (de nature hiérarchique ou associative). Les processus de traitement de la structure des événements sont responsables de ce niveau de perception et de compréhension (Figure 1). Imaginez vous assis dans une salle de concert attendant l'arrivée du chef d'orchestre. Les musiciens sont en train de s'échauffer créant ainsi un magma sonore de forte intensité. Même en écoutant attentivement, vous ne parvenez pas à saisir de relation entre ce que chacun joue. Vous en concluez que probablement chaque musicien répète différents passages de la partition. Puis le concert commence. Cette fois, les événements semblent se suivre naturellement et vous percevez clairement que l'oeuvre progresse et se développe dans le temps. L'exposition des thèmes vient juste de finir, et vous entendez des accords modulant nettement différents de ceux de la section précédente. Ces changements de tonalités indiquent que le développement des thèmes est commencé. Saisir cette progression suppose que chaque nouvel événement sonore puisse être relié aux précédents. Lorsque ces nouveaux événements sont complètement inconnus de l'auditeur, ou ne correspondent à aucun système de relations connues, des processus de structuration plus élémentaires telle que la segmentation en groupes d'événements pourraient opérer directement sur la base des relations existant entre les attributs de surface.

L'élaboration d'une représentation mentale de la structure des sons actuellement perçus par l'auditeur constitue le stade final du traitement de la structure des événements Son étude est essentielle pour la psychologie cognitive. En effet cette représentation mentale est cruciale pour une modalité sensorielle où les stimulations sont totalement transitoires. Comme il n'y a pas d'objet persistant dans l'audition, l'information relative aux événements acoustiques doit être stockée dans le temps, anticipée activement et traitée en fonction des expériences antérieures. Ainsi par exemple dans une symphonie, la saisie du développement des différents événements musicaux nécessite d'avoir élaboré une représentation mentale de ce qu'il s'est produit au début de l'oeuvre. De cette façon on peut réaliser par exemple que, à ce moment précis, la musique s'oriente progressivement vers la phase de réexposition des thèmes ce qui indique la fin prochaine du mouvement. Bigand présente plusieurs processus impliqués dans le traitement des structures d'événements et dans l'élaboration d'une représentation mentale de l'organisation des sons de l'environnement . Ces processus déterminent vraisemblablement la capacité de l'auditeur à établir des relations sur de grandes échelles de temps et ainsi à apprécier la forme et le développement des idées musicales.

La perception de l 'organisation des événements a des conséquences importantes pour le traitement de l'information auditive puisqu'elle constitue un cadre de référence qui va fortement influencer la structuration des informations sonores à venir : des anticipations et des attentes perceptives vont être mises en oeuvre orientant l'attention de l'auditeur sur des événements à venir bien particuliers ou sur des moments spécifiques de la séquence. Ces processus attentionnels pourraient aussi être affectés par des régularités perçues dans la structure du stimulus. Il est possible en retour que l'attention influence des processus d'organisation de bas niveau voire même influence les processus de transduction sensorielle. L'attention dans le domaine auditif et ces implications pour la perception et l'action sont développés dans le chapitre de Jones & Yee


Références

Aran, J.-M., Dancer, A., Dolmazon, J.-M., Pujol, R. & Tran Ba Huy, P. (1988). Physiologie de la cochlée. Editions INSERM/E.M.I., Paris.

Botte, M.-C., Canévet, G., Demany, L. & Sorin, C. (1989). Psychoacoustique et perception auditive. Editions INSERM/E.M.I./S.F.A., Paris.

Bregman, A. S. (1990). Auditory scene analysis: The perceptual organization of sound. MIT Press, Cambridge, Mass.

Coren, S. & Ward, L. M. (1989). Sensation and perception, 3rd ed. Harcourt, Brace, Jovanovich, San Diego.

Dooling, R. J. & Hulse, S. H. (1989). The comparative psychology of audition: Perceiving complex sounds. L. Erlbaum Assoc., Hillsdale, N.J.

Dowling, W. J. & Harwood, D. L. (1986). Music cognition. Academic Press, Orlando, Florida.

Handel, S. (1989). Listening: An introduction to the perception of auditory events. MIT Press, Cambridge, Mass.

Humphreys, G. W. & Bruce, V. (1989). Visual cognition: Computational, experimental, and neuropsychological perspectives. L. Erlbaum Assoc., Hillsdale, N.J.

Marr, D. (1982). Vision: A computational investigation into the human representation and processing of visual information. W. H. Freeman, San Francisco.

Moore, B. C. J. (1982). Introduction to the psychology of hearing, 3d. ed. Academic Press, London.

Pinker, S. (ed.) (1984). Visual cognition. MIT Press, Cambridge, Mass. [reprinted from Cognition, vol. 18].

Roman, R. (in press). Le système auditif central: Anatomie et physiologie. Editions INSERM/E.M.I., Paris.

Sloboda, J. A. (1985). The musical mind: The cognitive psychology of music. Clarendon Press, Oxford.

Warren, R. M. (1982). Auditory perception: A new synthesis. Pergamon Press, New York.

____________________________
Server © IRCAM-CGP, 1996-2008 - file updated on .

____________________________
Serveur © IRCAM-CGP, 1996-2008 - document mis à jour le .