IRCAM - Centre PompidouServeur © IRCAM - CENTRE POMPIDOU 1996-2005.
Tous droits réservés pour tous pays. All rights reserved.

La musique, les structures mentales et le sens

Marvin Minsky

Le compositeur et l'ordinateur, Ircam, Paris, 17-21 février 1981
Copyright © Ircam - Centre Georges-Pompidou 1981, 1999


Pourquoi aimons-nous la musique ? Nous avons beau nous y plonger plusieurs heures par jour, nous savons fort peu de choses sur la manière dont elle touche nos structures mentales. Chacun sait comme elle affecte nos émotions, mais personne ne pense à la façon dont elle affecte nos autres modes de pensée. Quels en sont les effets cognitifs ? Il est remarquable qu'on se soucie si peu d'une influence à ce point omniprésente. Que pouvons-nous découvrir si nous nous lançons dans l'étude de la pensée musicale ?

A la question : pourquoi aimons-nous la musique ? je proposerai quelques réponses hypothétiques seulement destinées à montrer de quel genre de théories nous avons, à mon avis, besoin. Il y a bien des années, à l'époque où la science craignait encore le sens, on s'aidait de certaines idées sur la représentation des connaissances ; ce sont elles que j'utiliserai ici. Il n'est pas exclu que la musique paraisse à certains étrangère à ces méthodes, comme étant trop subjective, et irrationnelle, trop esthétique, trop liée aux émotions. Mais je maintiens, pour ma part, que ces distinctions sont fausses, et que les problèmes ne se posent pas différemment dans ce domaine. Car c'est seulement en surface que la raison est rationnelle.(1)

Il y a plus : nous devons une grande partie de nos connaissances actuelles sur les structures mentales à des domaines d'étude qui, naguère, n'étaient pas considérés dignes d'intérêt : le travail de Freud sur les rêves et sur les mots d'esprit a révélé l'inconscient, et celui de Piaget sur le langage et les jeux des enfants a inauguré la psychologie génétique. Pourquoi a-t-il fallu que les travaux de Freud et de Piaget attendent les temps modernes ? Avant eux, les enfants paraissaient trop enfantins, et l'humour trop fantasque, pour que la science les prenne au sérieux. Et, plus récemment, des travaux sur le bon sens sont venus revitaliser la théorie cognitive.

Pourquoi, donc, aimons-nous la musique ? En matière de musique et d'art, nous hésitons tous à soumettre ce qui gratifie nos appétits de plaisir et de puissance à l'examen. Pour partie, c'est le succès de celui-ci que nous craignons : et si la connaissance gâtait le plaisir ? Nous n'avons d'ailleurs pas tout à fait tort : l'art perd souvent de sa force quand on en découvre les racines psychologiques. Mais peu importe : le moment venu, nous saurons bien, comme toujours, nous inventer de nouvelles illusions.

Mon sentiment est que la théorie musicale s'est placée dans une impasse à se mettre en quête d'universaux. Nous sommes pleins d'envie pour les scientifiques qui en trouvent, c'est évident. Mais je ne pense pas que notre cas soit comparable, tant, pour notre part, nous avons affaire à une interaction de la mémoire et des processus mentaux. C'est pourquoi une grande partie de cet essai est consacré à examiner comment, chez chacun d'entre nous, l'écoute musicale engage les connaissances.

En outre, la théorie musicale, c'est un peu comme lorsqu'on jette le bébé avec l'eau du bain. La question de savoir ce qui fait qu'une musique est bonne est devenue un tel tabou que nous en oublions qu'elle demeure le problème-clé. Certes « des goûts et des couleurs, on ne discute pas » -- en général. Mais peu importe ; car si des personnes différentes ont des goûts différents, on ne peut pas se permettre de déclarer tout simplement qu'il n'y a pas là de problème. Au contraire, il faut tenter d'expliquer le pourquoi et le comment de cette situation. Il convient d'adapter nos visées en constatant que la théorie musicale ne porte pas seulement sur la musique, mais aussi sur la façon dont les gens la « traitent ». Pour comprendre l'art, il nous faut regarder sous la surface, en pénétrant dans la psychologie de la création et de la réception.

Il peut sembler plus difficile d'avoir affaire aux structures mentales qu'aux chansons ; il n'en arrive pas moins, quelquefois, qu'en élargissant la cadre où se posent les problèmes, on simplifie ceux-ci. La théorie des racines des équations a paru difficile pendant des siècles parce qu'on restait dans le petit monde des nombres réels ; puis elle devint simple une fois que Gauss eut découvert l'univers plus vaste des nombres dits compIexes. Il en va de même en matière de musique : certains problèmes qui paraissent obscurs en termes absolus paraîtront plus clairs une fois qu'ils auront été posés dans le contexte des structures mentales de l'auditeur.

De la sonate considérée comme machine pédagogique

Incontestablement, la musique produit des effets sur nos structures mentales. Plus loin, nous proposerons quelques hypothèses sur ces effets. Il est certain qu'après l'écoute, une bonne partie de l'effet produit s'évanouit ; mais il en reste quelque chose. Qu'en est-il exactement de ce reste ?

La vieille histoire qu'on raconte sur Mozart (et que je ne crois pas) veut qu'il se soit souvenu de toute la partition. Mais la plupart des gens ne se souviennent même pas des thèmes du concert de la soirée. Et pourtant quand on rejoue les airs, ils les reconnaissent. Il y a donc bien quelque chose qui reste, et qui rend les airs « familiers ». Et si ce reste était dû, non à la musique elle-même, mais à la manière de l'entendre ?

Considérons à quel point un professeur fonctionne comme la forme sonate ! Il commence par attirer l'attention de la classe, peut-être de façon théâtrale, ou bien en recourant au procédé plus subtil qui consiste à parler à voix presque basse. Puis vient la présentation méthodique des divers éléments : inutile d'introduire trop d'idées à la fois, ou de les développer prématurément. Tant que les thèmes ne sont pas assimilés, les auditeurs ne peuvent rien en faire. C'est pourquoi on commence par répéter, avec insistance. Il en va de même des sonates, où une idée est d'abord exposée, puis une autre, et puis la première est récapitulée pour plus de sûreté.

Ainsi l'Exposition a pour but d'exhiber le matériau de base -- les atomes des transformations chimiques à venir, et le Développement fabrique des molécules à partir de ces atomes ; alors des composés connus, fragments de mélodie et de rythme, peuvent entrer dans la danse des rapprochements et des oppositions, des heurts et des fusions.

Ce dont on se souvient le plus facilement, c'est ce qui trouve le plus facilement place dans des cadres familiers. C'est pourquoi, à l'opposé, il est très difficile de se souvenir de ce qui n'a pas de sens. Ou plutôt, c'est le contraire ; n'a de sens que ce qui permet au récepteur de se retrouver dans des schémas de représentation et de traitement connus. Tout comme les bons textes et les bonnes conférences, les sonates partent donc de choses simples, sur lesquelles nous faisons des exercices de répétition avant de passer à des choses plus sérieuses. A la fin d'une leçon, personne ne se souvient de tout ce qui a été dit -- mais si on a compris, on possède alors ses propres réseaux de connaissance, tant sur les thèmes eux-mêmes que sur la façon dont ils fonctionnent.

Après une seule écoute, personne ne peut se souvenir de la totalité de la Cinquième Symphonie de Beethoven. Mais ces quatre notes, elles ne peuvent plus jamais, pour personne, être simplement quatre notes.

Ce qui n'était qu'un petit filet sonore est maintenant chose connue -- un véritable réseau de sens et de signification.

Si les sonates sont des leçons, quel en est le sujet ? La réponse est dans la question. La Cinquième Symphonie a enseigné à ceux de notre culture qu'une tierce majeure descendante avec la première note répétée trois fois signifie désormais, et à jamais, « tierce et quinte en mode mineur. » (Ce qui n'est pas banal, puisque notre première impression pourrait fort bien être « tierce et première en mode majeur ». Quelle chose étrange à faire entrer dans nos têtes !

La Cinquième énonce immédiatement son sujet avec son double, presque identique. Puis elle expose sa découpe métrique : deux périodes symétriques de quatre mesures chacune. D'abord vient le thème. (Exposé à l'unisson de l'orchestre, le mode en reste ouvert pour l'instant -- mais ce ne sera plus jamais le cas. De même, la découpe métrique est encore floue : le sujet est seul dans le temps.) Puis vient le double. (La partition permet de concevoir ce symétrique transposé comme un complément, ou même comme un nouveau départ).

Les quatre mesures suivantes -- la seconde partie de la découpe -- exposent trois versions du sujet, chacune s'appuyant, dans l'ordre ascendant, sur l'une des trois notes à fonction tonale. (Maintenant, nous sommes sûrs que nous sommes en mineur). On nous montre comment le sujet peut se chevaucher lui-même, les trois notes brèves étant parfaitement réparties dans l'espace de temps de la longue. Puis l'autre moitié de la découpe métrique vient nous proposer trois exemples de complément, en degrés ascendants de septième dominante. A ce stade de conformité, on n'a plus le loisir de se demander comment vont pouvoir se marier les deux périodes de quatre mesures.

La découpe suivante, de huit mesures, nous démontre comment on peut adoucir le caractère rigoureux de la figure, et comment comprimer le temps harmonique ; elle nous montre aussi comment contrebalancer l'image en miroir du sujet : seconde utilisation du contrepoint à l'intérieur de la note tenue. Et une nouvelle découpe métrique vient se superposer à la réminiscence de la précédente. (A la fois à la même et à une double échelle).

(Cadence.) (Silence.) (Presque.) (Total.)

Leçon suivante : cette fois, c'est le pendant du sujet qui est seul dans le temps. Et, de nouveau, le chef doit choisir sa symétrie : laquelle va-t'il mettre en valeur ? Faut-il qu'il donne suite à la cadence précédente, qu'il reparte à zéro, ou qu'il ferme la parenthèse ouverte au début ? Peut-il faire tout cela à la fois en conservant la découpe métrique ? En tout cas, le sujet s'étire en un long fa à l'unisson (sous-dominante ?) ou l'étudiant trouvera amplement matière à réflexion. (Car sous la surface sonore, ici paisible, presque silencieuse, on s'entend réciter mentalement ce qu'on vient d'entendre).

La découpe suivante nous indique la façon dont il faut entendre le sujet sur chaque degré principal, mais cette fois par paliers descendants. (Voilà : c'était donc une neuvième dominante, pas du tout une sous-dominante. On s'est fait avoir -- mais c'est bien la dernière fois). Et maintenant, voici le tour de force d'exhaustivité didactique : le sujet est exposé à chaque degré (ascendant) sur pédale de tonique ; puis il est placé sur chaque tonique, transformé en pur arpège, et descendant ; enfin, (et c'est ici qu'est indiquée la quatrième possibilité, de direction et d'harmonie) -- enfin nous assistons à la réduction du sujet en une seule note qui s'impose, qui va même s'amplifiant. (L'un des mystères de l'art a toujours été pour moi dans l'effet produit, dans les quatuors, par ces moments où la texture se réduit à une seule ligne mélodique, et où le forte-piano fait honte au sforzando. Mais réfléchissons : l'acte même par lequel la surface dit le moins, il est certain qu'il signifie le plus de différence sous-jacente. Un peu plus loin, je proposerai un procédé qui révèle comment de tels changements, si soudains, si pénétrants, font vibrer tant d'« indicateurs de différences ». Un changement en fait vibrer tant, et ceux-ci à leur tour tant encore, que toutes les structures mentales en sont mises en éveil).

Tout cela, nous l'avons appris en moins d'une minute de la durée de la leçon. Et je n'ai fait qu'effleurer un des aspects de la rhétorique beethovenienne ; car les professeurs ne se contentent pas d'expliquer ils implorent et menaçent, ils calment et font peur, ils recourent au geste, au timbre, au trémolo, parfois même au silence. (ça aussi, c'est capital, dans la musique. Dans la Cinquième, c'est même le point de départ du sujet). Ces leçons , elles doivent nous en apprendre autant sur les triades et sur les triolets que ce que les mathématiciens ont appris sur les angles et sur les côtés des triangles. On a le souffle coupé à l'idée de la somme de connaissances sur les intervalles de seconde mineure que nous devons à ce que Beethoven a fait dans l'Opus 133.

Mais pourquoi diable aurait-on envie d'apprendre tout cela ? La géométrie, elle, peut servir -- par exemple -- à construire des pyramides ; mais à quoi peut bien servir la connaissance musicale ? (4) Voici un élément de réponse parmi d'autres. Chaque enfant passe des journées entières à d'étranges occupations ; nous disons qu'il « joue ». Il joue avec des cubes et des boîtes, qu'il empile et qu'il place les uns dans les autres, qu'il aligne et qu'il fait tomber. De quoi s'agit-il donc ? Eh bien, il apprend l'espace. Mais comment diable apprend-on le temps ? Est-ce qu'un temps peut entrer dans un autre, est-ce qu'on peut en mettre deux côte à côte ? C'est la musique qui nous le dit.

Nous avons tous diverses façons de penser et d'écouter la musique. Mais nous sommes nombreux à subir une sorte de fascination ludique dès qu'il s'agit d'élaborer des constructions à partir de petits éléments. Or il est clair qu'au moins une façon de comprendre la musique consiste à élaborer mentalement des structures de grandes dimensions à partir de petits objets musicaux. Il se peut même que cet instinct qui nous pousse à construire des structures ne soit pas si éloigné de celui qui nous fait souhaiter comprendre le monde. C'est peut-être le même mécanisme, ou bien c'en est simplement une copie accidentelle, après mutation : souvent, l'évolution redouble des tas de choses inutiles pour obtenir un changement minime.

Quoiqu'il en soit, il apparaît que la musique n'est pas toujours utilisée à des fins très réjouissantes : parfois, elle sert à occuper et à pervertir ce mécanisme de structuration. Il est bien connu que rien ne peut empêcher l'esprit de fonctionner quand nos pensées nous font mal. Nous avons beau essayer de le distraire : d'après certains, rien n'empêche les pensées perfides de nous ronger de l'intérieur. Il se peut que la musique dite « d'atmosphère » transforme ces pensées mauvaises en pensées neutres, comme si, pour calmer, elle saturait l'inconscient, abandonnant à elles-mêmes les pensées de surface. Les « significations » ainsi convoquées pourraient fort bien ne constituer que des réseaux solipsistes autonomes -- des tissus de références croisées ayant l'apparence de sens, amis sans aucun contact avec la réalité. Dans un tel univers auto-élaboré, il n'est besoin ni de vérité ni de mensonge, de bien ou de mal, de chagrin ou de joie. Sous cet angle peu engageant, la musique sert tout juste à ménager une belle issue à la pensée qui se fuit.

Les théories syntaxiques de la musique

Considérons deux réponses possibles à la question : « Qu'est-ce-qui nous fait aimer certaines musiques ? »
« ... certains traits structuraux spécifiques. »
«  ... leur ressemblance avec d'autres musiques qui nous plaisent. »

La première réponse implique la recherche des lois et des règles qui rendent les musiques agréables. Tout comme dans le cas du langage, nous savons des choses qui paraissent importantes dans le cas des mélodies ; mais, en musique, aucune de ces choses ne paraît indispensable. De la recherche des règles formelles qui gouvernent la phrase musicale, je ne crois pas qu'il y ait encore beaucoup à attendre.

La seconde réponse suppose une quête de la signification selon d'autres voies que celles de la musique elle-même ; de même, la question : « Dans le langage, quelles sont les phrases qui ont un sens ? » sort de la pratique linguistique connue de tous pour pénétrer dans les réseaux enchevêtrés des pensées de chacun, lesquels sont autoreproducteurs : comme dans tous les domaines, nous avons tendance à aimer ce qui nous rappelle d'autres choses que nous aimons. C'est ainsi que certains d'entre nous aiment, en musique, ce qui ressemble aux chansons, et même aux comptines ou aux psaumes de l'enfance. Mais ceci suppose vrai ce qui est en question, car si nous aimons ce qui resemble à ce que nous aimons, où est-ce que tout cela commence ? J'y reviendrai.

Même le terme « ressembler » constitue une pétition de principe : quelles sont donc les règles de la ressemblance en musique ? Ici, ma conviction est que la réponse dépend de la façon dont les mélodies sont « représentées » par nos structures mentales. Et ceci peut varier selon les dispositions ; le même air, écouté en des moments différents, peut paraître changer de rythme, de mode ou d'harmonie. Et les individus diffèrent même au-délà de cette distinction. Certains auditeurs détestent les symétries et les équilibres que d'autres remarquent à peine. Un beau sujet de fugue paraît banal à celui qui ne perçoit qu'une seule ligne mélodique, mais il ravira celui qui peut y superposer une autre partie. Le contrapuntiste qui improvise doit harmoniser chaque réminiscence qui s'estompe avec ce qu'il va jouer ; peut-être Bach était-il capable d'envisager mentalement plusieurs réminiscences à la fois. (Mais une seule suffirait peut-être à permettre de choisir ce qui doit suivre. Il suffit aux improvisateurs d'essayer puisque, tels des prestidigitateurs ils connaissent suffisamment de façons de « s'en sortir » pour qu'au moins la musique continue, quand les expériences audacieuses se soldent par un échec).

Les explications à base de « traits spécifiques » ne peuvent même pas aborder à la description de tels processus. Les méthodes « générative » et « transformationnelle » (c'est-à-dire les méthodes néo-schenkeriennes) d'analyse syntaxique conviennent beaucoup mieux aux fins d'analyse. De notre point de vue, cependant, le but même des théories syntaxiques pose un problème, car s'il consiste à décrire les produits de l'activité mentale, il ne nous aide pas à comprendre comment ces produits sont produits. De sorte que pour comprendre comment les processus mentaux et la mémoire fusionnent dans « l'écoute », il faut chercher des méthodes plus « procédurales », c'est-à-dire des méthodes susceptibles de décrire les processus relevant de l'informatique.(5)

Je ne comprends pas pourquoi les théoriciens seraient troublés par cette perspective. Il est vrai que ce nouveau pouvoir que nous avons, nous le payons : à l'aide de la description de type informatique, on peut en dire davantage, mais on prouve moins. Pourtant, la perte est moins considérable que beaucoup ne le croient ; pour commencer, les mathématiques elles-mêmes n'ont jamais pu prouver grand chose dans ces domaines fort complexes. Les théorèmes nous disent habituellement des vérités complexes sur des choses simples ; il est rare qu'ils nous donnent des vérités simples sur les choses complexes. Penser autrement relève des fantasmes.

Et s'il y a un prix à payer, il y a aussi un profit à tirer. Il est probable que bien des problèmes formels nous résisteront ; mais certains céderont de toute façon grâce aux simulations futures qui nous permettront de développer artificiellement des réseaux sémantiques musicaux, peut-être en « élevant » des enfants simulés dans un contexte de musique traditionelle. (6) Nous serons récompensés le jour où quelqu'un fera preuve d'un véritable « talent ».

La musique et l'espace

Contrairement à ce qui se passe quand on entre dans une pièce, ou on a l'impression de tout voir d'un seul coup, on ne « voit » pas toute une symphonie d'un seul coup. « C'est évident », entendra-ton dire, « puisque l'ouïe se déploie dans le temps, tandis que la vision se déploie dans l'espace ». Mais en fait il faut du temps pour voir de nouvelles scènes, même si nous n'en sommes pas toujours conscients.

Que la conscience voie la vue comme fonctionnant de façon instantanée et immédiate, voilà qui en dit long sur la plus étrange de nos illusions « optiques ».

Il n'en reste pas moins que la musique est capable de nous immerger dans des univers qui paraissent stables. Je serai tenter d'expliquer ce phénomène en disant qu'écouter de la musique, c'est comme voir un paysage. Seulement, au lieu de traiter légèrement cette simple analogie, j'en ferai un argument de masse et décisif : il est vrai que la bonne musique provoque une activité mentale comparable à celle que déclenche la vue (7). Et par « bonne » musique j'entends bel et bien de la « bonne » musique. Cette petite théorie ne s'applique certes pas à tous les tours que les compositeurs ont dans leurs poches, mais seulement à certaines sortes de musiques.

Quel que soit l'objet de nos regards, nos yeux prennent d'innombrables clichés rétiniens en l'espace d'une seconde. Et pourtant, durant toute cette activité, nous ne percevons, dans le monde, ni changement ni mouvement. Chaque objet repose « calmement » à sa place. Qu'est-ce-qui fait de nous des coperniciens innés, et pourquoi les objets nous paraissent-ils si stables alors que leurs images « sautent » sans arrêt ? Je commencerai par tenter de dire comment cela fonctionne dans la vision puis je passerai à la musique.

La société des agents mentaux

Quand nous parlons de l'illusion, nous pensons toujours à quelqu'un qui se fait rouler ; et ce quelqu'un, c'est peut-être nous-mêmes. « Je sais que ces lignes sont droites », dira-t'on, « mais elles me paraissent courbes ». Eh bien, tâchons d'identifier le « je » et le « me » dans cette proposition.

En réalité, nous sommes tous convaincus qu'en chacun d'entre nous se pavane un Moi central, entier, indivisible, et, du moins nous l'espérons secrètement, indestructible. Au lieu qu'à mon avis il y a plusieurs agents mentaux au travail en chacun de nous. Chacun de ces agents a à connaître de certains évènements mentaux, mais pas de tous. Dans cette perspective, une proposition du type « Eloise n'avait pas conscience de (la présence de) X » a beaucoup moins de sens que nous ne le pensons -- à moins que nous n'y ajoutions quelque information sur l'identité des agents mentaux d'Eloise qui n'étaient pas concernés par X. Penser, c'est mettre au travail nos agents mentaux ; nous y réussissons lorsque nous parvenons à diviser les problèmes et à en attribuer les divers aspects aux agents spécialisés pour les traiter. (Certains ne sont que des tâcherons) .

Dans la division du travail que nous appelons « la vue », je supposerai qu'une partie de notre dispositif mental -- que je nommerai le DETECTEUR de traits -- envoie des messages concernant les traits distingués sur la rétine à un autre agent que nous appellerons l'ANALYSTE. A la réception de beaucoup de messages de ce type, celui-ci tire ses conclusions et, à son tour, il envoie ses propres messages à d'autres agents mentaux.

Imaginons, par exemple, que DETECTEUR transmette une information fragmentaire sur des arêtes et des textures, et qu'ANALYSTE les rassemble pour décrire une forme (disons le pied d'une table). A son tour, ANALYSTE va envoyer des messages -- par exemple à DECOUVREUR, lequel a pour mission de faire la synthèse des preuves selon lesquelles il y a bien une table en vue. Au terme de plusieurs étapes de ce type, les produits de ces messages parviennent finalement au CONSTRUCTEUR D'ESPACE, l'agent qui a pour mission d'informer d'autres agents sur l'existence d'objets réels dans l'espace réel. Mon premier argument est le suivant : les messages envoyés par ANALYSTE à DECOUVREUR ont beau être fondés sur les preuves rassemblées par DECOUVREUR, les messages eux-mêmes en disent fort peu, ou rien du tout, sur DECOUVREUR lui-même, ou sur ce qu'il a fait. Ceci n'est dû qu'en partie au fait qu'il faudrait trop longtemps à l'ANALYSTE pour tout expliquer ; la raison principale en est que les récepteurs n'ont pas l'usage, ou même la faculté de comprendre ce type d'information, car ils ne sont ni ingénieurs ni psychologues : ce sont tout simplement de petits réseaux nerveux spécialisés. (8) et (11)

La représentation du monde que se fait CONSTRUCTEUR D'ESPACE n'évolue qu'au gré des besoins. Quand on lève les yeux, on ne craint pas que le sol ait disparu, parce que CONSTRUCTEUR D'ESPACE n'a reçu aucun message lui enjoignant de retrancher le sol du modèle « chambre » qui a toujours cours pour nous. L'article que j'ai consacré aux « systèmes de découpage » (E) en dit plus sur cette théorie particulière ; pour l'occasion, il ne nous manque que quelques détails sur DECOUVREUR et ANALYSTE.

Dans ce schéma, les messages partent dans des directions variées. Par exemple, chaque mouvement de l'oeil, de la tête ou du corps remet DECOUVREUR au travail ; mais ces mouvements ne sont eux-mêmes que des réactions (dûes aux agents MOTEURS) aux messages envoyés par ANALYSTE quand il a besoin de lever des ambiguités, ou de découvrir quelques détails supplémentaires. Mais ANALYSE lui-même reçoit des messages de « plus haut » ; par exemple, CONSTRUCTEUR a pu demander à DECOUVREUR : « ceci est-il une table ? » Là-dessus, DECOUVREUR se dit : « Je crois bien, mais il manque un pied », et il demande à ANALYSTE de vérifier ce point, ce qu'ANALYSTE fait en ordonnant à MOTEUR D'OEIL de regarder en bas et à gauche (9).

Revenons maintenant à nos illusions. Si DECOUVREUR n'exécute pas les tâches instantanément, il ne le fait pas moins très, très vite : c'est un assembleur hautement performant. A toutes les questions que pose ANALYSTE, DECOUVREUR répond en un clin d'oeil, de l'ordre d'un dixième de seconde (ou moins si nous disposons d'isolants). En faisant appel à sa mémoire, CONSTRUCTEUR lui-même peut souvent reconnaître ce qu'il a déjà vu. Or je dis que c'est cette vitesse qui est à l'origine de nos illusions : si les réponses nous parviennent aussitot que les questions ont été posées, il nous semblera qu'elles ont toujours été là.

Il y a une autre façon dont l'illusion se trouve confortée : par « attente » ou par « défaut ». Car nos agents savent bien mentir ou bluffer ! Manquant de preuves pour affirmer qu'il y a « table », DECOUVREUR fournit à CONSTRUCTEUR des détails fantaisistes sur une « table typique » pendant que ses subordonnés se livrent à une enquête sur la vraie table. Ainsi informé, CONSTRUCTEUR est en mesure d'élaborer rapidement des projets, et sans grands risques, puisqu'il pourra corriger par la suite. Bien entendu, ceci ne marche que si les prototypes sont bons mais c'est précisément cela, l'intelligence.

Quant à la « conscience » de la façon dont les choses se passent, il n'y a tout simplement pas de place pour elle. CONSTRUCTEUR est trop altier pour comprendre ou même avoir le souci de savoir comment DECOUVREUR exécute sont travail d'observation visuelle. Certes, chaque agent a besoin de savoir lequel de ses subordonnés sait faire ce qu'il a à lui demander ; mais la façon dont cela se fait n'a guère sa place -- ni son utilité -- dans les minuscules dispositifs mentaux qui sont à l'intérieur du nôtre. Chaque partie de notre cerveau ignore presque tout de ce qui se passe à côté. (Et c'est pourquoi nous avons besoin de psychologues car si du fait que ces agents sont si facilement pris en « défaut », nous pensons savoir ce qui se passe dans nos têtes, en réalité nous avons presque toujours tort).

Mais revenons à l'analogie que j'ai proposée pour comparer la façon dont la musique construit quelque chose dans la tête de l'auditeur à celle qu'a la vision de faire la même chose chez l'observateur. Les mouvements des yeux nous font découvrir des objets réels ; les phrases musicales nous font découvrir des objets musicaux. Nous « apprenons » une chambre à l'aide de mouvements du corps ; les grands fragments de musique nous indiquent des « lieux musicaux ». Il faut marcher et grimper des escaliers pour aller de chambre en chambre : c'est ce que font les transitions entre les parties. Dans la vision, le geste de se retourner en musique, l'acte de répéter ou de récapituler, c'est la même chose : dans les deux cas on est ramené en arrière pour affirmer ou pour réviser notre conception de l'ensemble. Ainsi, dans une sonate l'écoute d'un thème est comparable à la perception d'un objet dans une pièce ; un allegro est comparable à la pièce elle-même, et la sonate tout entière au bâtiment. Il reste néanmoins un grand problème à régler à propos de cette analogie : qui règle le processus ? Cette question est posée dans les pages suivantes.

Je n'ai pas voulu dire que la musique construit exactement comme le fait CONSTRUCTEUR D'ESPACE. (Je sais que cela est trop naïf : c'est dans les poèmes enfantins que l'on compare les sons aux lieux. Et pourtant, la vérité est peut-être dans les pensées les plus simples). Ce que je veux dire, c'est que les compositeurs simulent la cohérence en faisant jouer les mêmes sortes de coordinations entre agents que celles qu'utilise la vision pour produire ses illusions. Il en va de même pour la parole, et notamment pour le sens que peuvent avoir ces pages -- si elles en ont un.

Rôle du compositeur et du chef d'orchestre

Dans la vision, les yeux bougent : l'observateur choisit comme il veut l'endroit où il les porte. Mais dans la musique, il faut écouter ici, c'est-à-dire ce qui est joué maintenant : il est inutile de demander au DECOUVREUR de musique de regarder là-bas ni de se projeter dans un autre temps que maintenant.

Mais si le compositeur et le chef d'orchestre sont les seuls à pouvoir choisir ce qu'on entend à chaque instant, est-ce que ce n'est pas notre analogie tout entière qui est menacée ? Aux questions que pose l'ANALYSTE de la musique, que peut répondre le DECOUVREUR -- à moins que la musique ne se trouve précisément et miraculeusement en train de jouer la réponse ? Et puis, comment la musique pourrait-elle peindre une scène, à moins que le compositeur ne sache ce qu'attend l'auditeur à chaque instant ? Comment faire en sorte, quand l'ANALYSTE veut quelque chose maintenant, que ce quelque chose soit précisément joué maintenant ?

Eh bien c'est là le secret de la musique-composition, exécution, direction. Bien entendu, il n'est pas nécessaire que la musique satisfasse intégralement l'attente de l'auditeur : chaque intrigue doit avoir quelque chose de nouveau. Mais, quel qu'en soit le contenu, il faut que quelqu'un règle le tout, sans quoi toute nouveauté finira en confusion. Si on laisse trop la bride sur le cou de l'auditeur, celui-ci, à propos de n'importe quelle partition, se posera des questions sans réponse sur des accidents de forme et de figure, de voix et de ligne, de tempérament et de son résultant.

C'est pourquoi chaque musicien doit anticiper et régler les fixations internes de l'auditeur ; en distrayant son attention, il l'attire exactement où il faut, pour forcer l'auditeur à (se) poser précisément la question à laquelle la musique est sur le point de répondre. C'est seulement au prix d'une telle harmonie pré-établie que la musique peut donner l'impression qu'un évènement (ou qu'un spectacle) se déroule là.

Rythme et redondance

En gros, une chanson a cent mesures et un millier de temps. Mettons-nous à la place d'un Martien : que signifient ces mesures et ces temps, ces mesures et ces temps ? Les mots eux-mêmes révèlent un caractère terriblement répétitif. Comment se fait-il que la musique ne soit pas ennuyeuse ?

L'audition est-elle si comparable à la vision que nous ayons besoin de cent coups d'oeil pour construire une image musicale ? Certaines textures musicales répétitives peuvent certes évoquer des éléments permanents tels que le vent ou un cours d'eau ; mais la plupart des sons sont uniques : à moins d'avoir entendu cette épingle tomber maintenant, il faudra la chercher partout ; c'est pourquoi nos oreilles n'ont pas de paupières. Or la poésie fait tomber des épingles : elle dit les choses une seule fois -- à peine. Il en va de même de la musique.

Pourquoi supportons-nous, dans la musique, la pulsation rythmique impitoyable ? La réponse est multiple, car nous entendons de diverses façons, sur des échelles différentes (10). Dans certaines manières d'entendre, nous nous représentons directement les segments temporels, mais d'autres nous parlent d'objets musicaux qui émergent de mondes où le temps se replie sur lui-même. Et c'est là, selon moi, que nous trouvons usage aux temps et aux mesures.

En clair, les découpes métriques de la musique ne sont que d'éphémères gabarits qui servent à des assemblages momentanés ; ses rythmes sont des « battements de synchronisation » qui servent à assembler des phrases nouvelles avec les phrases connues, pour mettre en valeur les différences et le changement.

Les différences et le changement ! C'est par étapes prudentes, et à partir de racines minuscules, que pousse la bonne musique. Et voyez avec quel soin nous traitons la nouveauté en la plaçant, comme dans un sandwich, entre des tranches de familier répétées ! La forme de changement la plus manifeste est la quasi-identité ; dans la pensée comme dans la vision, ce sont de légères modifications du point de vue qui révèlent le mieux la forme d'un objet, voire sa présence.

Lorsque nous avons comparé la sonate à une leçon, nous avons vu comment des « découpes métriques » différentes étaient assemblées, et qu'il était facile, à partir de là, de discerner les idées musicales. Et puis nous pouvons voir comment un certain intervalle, qui était , a été modifié ici par l'addition de tonalités de passage, et comment un accord de septième passe ici en neuvième. C'est ainsi que l'assemblage nous met en mesure de percevoir ensemble des choses séparées. Et c'est la fusion de toutes ces unités séparées (comme à la télévision) qui produit sur nos écrans mentaux ces magiques images musicales.

Comment faire faire ce travail à nos agents musicaux ? Il faudrait les organiser d'une certaine façon ; en voici une qui pourrait fonctionner et qui utilise quatre niveaux :

(Je ne donnerai pas davantage de détails pour l'instant. Mais on trouve beaucoup de ces idées dans les travaux actuellement consacrés à la vision) (11). Premier temps : les Découvreurs auscultent le flux sonore afin d'y trouver les exemples les plus simples de la signification en musique : entrées et enveloppes ; les sons eux-mêmes, et autres petits évènements ponctuels.

Deuxième temps : les Preneurs de mesure recherchent les éléments temporels communs à ces petits évènements ; en les classant par groupes, ils trouvent le rythme et peuvent en postuler les règles. Une fois que les agents assignes au mètre ont trouvé les genres de groupes qu'ils veulent entendre, les Trouveurs de différence peuvent commencer à percevoir les évènements d'importance musicale : initiations et inversions, syncopations et suspensions. Alors on peut commencer la Construction des Structures à grande échelle.

Les notes se font figures, celles-ci se font phrases, et les phrases séquence ; d'autre part, les notes se font accords, et ceux-ci bâtissent une progression, etc, etc. La relation de chaque niveau se fait Objet lorqu'on passe au suivant : ainsi, le travail de la mémoire, et la faculté de comparaison, s'en trouvent facilités. Du point de vue du temps, c'est un processus qui fait tout « travailler », changeant le son en tonalité, et la ligne en polyphonie.

Plus le rythme est régulier, plus l'assemblage est facile, et moins les agents de différence sont excités à poursuivre leur travail. C'est ainsi qu'une fois utilisée pour le « repérage », la structure métrique ne retient plus notre attention, parce qu'elle fait l'objet d'une représentation en tant que cadre fixe et constant (comme le plancher de la pièce où vous êtes) jusqu'à ce qu'une altération métrique fasse changer d'avis nos Preneurs de mesure (12). Mais il y a plus, car cette Agence à quatre niveaux n'est elle-même que l'un des niveaux d'un système plus large dans lequel des structures analogues sont répétées à plus grande échelle. A chaque degré de cette échelle un nouveau niveau d'ordre (accompagné de son propre jeu d'Objets et de Différences) opère des descriptions à plus grande échelle, accomplissant ainsi un autre ordre de la forme structurale. C'est ainsi qu'alors même que les régularités sont cachées à notre attention, chaque nuance d'expression qui est perçue se trouve transmise : rubato et crescendo, ornement et tonalité de passage. Les altérations de chaque niveau constituent les objets concrets du suivant. Le mystère est éclairci : le cerveau excelle tant à percevoir les différences à chaque stade qu'il oublie les objets eux-mêmes, quand ils ne sont pas différents. Quant aux raisons pour lesquelles on aime la musique, c'est ce dont il est question dans les pages qui suivent.

L'explication « sentique »

Pour commencer, comment se fait-il que nous aimons certains airs ? Est-ce que nous nous contentons de les associer à des expériences agréables ? Faut-il retourner aux sonorités et aux traits caractéristiques de la voix, et même des battements du coeur, de la mère ? Ou bien se peut-il que certains airs soient naturellement agréables ? Toutes ces explications peuvent détenir une parcelle de la vérité, ainsi que d'autres -- car, dans le domaine des activités mentales, rien ne procède d'une seule cause.

Dans son ouvrage intitulé Sentics, (C), Manfred Clynes, physiologiste et pianiste, décrit certains schémas sensoriels-temporels spécifiques et soutient que chacun de ces schémas est associé à un certain état émotif parmi les plus communs. Par exemple, dans ses expériences, deux schémas particuliers (représentés par une courbe ascendante et par une courbe descendante modérées) sont censés induire des états d'amour et de respect ; deux autres (plus abrupts) siginifient la colère et la haine. Selon Clynes, ces schémas, ainsi que d'autres, il les appelle « sentiques » -- produisent les mêmes effets quel que soit le sens qui est sollicité, c'est-à-dire, qu'ils se manifestent par l'intensité acoustique, le timbre, la pression tactile, ou même le mouvement visuel ; d'autre part, ce phénomène serait transculturel.

Les longueurs de temps de ces formes « sentiques », qui sont de l'ordre de la seconde, pourraient correspondre à des segments de phrases musicales. C'est avec cette idée en tête que Clynes a étudié les détails musculaires de diverses exécutions instrumentales, et il a conclu qu'à travers ces signaux innés, un certain type de musique provoque l'émotion. (Ceci serait vrai davantage dans le cas de la musique classique que dans celui de la musique impressionniste). Ces résultats me paraissent bons, mais ils sont un peu prématurés, et il faudra d'autres expériences pour s'assurer que les signaux « sentiques » ont bien cet effet, qu'ils sont bien innés, ou même qu'ils existent vraiment. Mais je ne serais pas surpris de découvrir que quelque chose de ce genre est au travail dans un domaine tout à fait différent, celui des premières phases du développement social de l'enfant.

Car il me semble que ces « signaux sentiques » seraient très utiles dans l'apprentissage de lui-même et des autres par lequel passe tout enfant. Toutes les théories de l'apprentissage supposent un cerveau pour imposer des « valeurs » aux évènements d'une manière ou d'une autre.

A cette fin, des stimuli physiologiques primaires tels que nourriture et boisson suffiraient peut-être. Mais les enfants humains doivent également apprendre des signaux sociaux. Au début de ce siècle, les théoriciens de l'apprentissage pensaient que des signaux sonores de nature sociale (par exemple, des signaux d'approbation) pouvaient devenir des renforceurs par association avec des renforceurs innés mais on n'a jamais pu prouver cette théorie. Si les parents pouvaient exploiter des indications « sentiques » innées, on ferait un pas vers l'explication de ce mystère.

On en ferait également un vers la solution d'un autre problème comment se forme-t'on un surmoi, ou une image de son propre dispositif mental ? La théorie du « renforcement » externe n'explique qu'une partie du processus cognitif ; il faut bien que l'enfant finisse par apprendre à apprendre de l'intérieur, c'est-à-dire, à se libérer de ses parents. Je pense, comme Freud, que les enfants substituent et augmentent le parent réel à l'aide d'une image parentale interne et auto-élaborée. Mais comment un bébé pourrait-il être assez intelligent pour se construire de tels modèles ?

C'est ici que l'hypothèse de détecteurs « sentiques » innés pourrait apporter quelque chose. Si des signaux distincts émis par autrui suscitent des états spécifiques, l'enfant peut fort bien associer ces signaux à ces états. La simple certitude de l'existence de ces états -- c'est-à-dire la possession de symboles pour les décrire -- représenterait une demi victoire. C'est seulement ensuite qu'il tirerait des discours sociaux quelques règles sur le comportement de ces états. Il pourrait par exemple apprendre que grâce à des signaux conciliatoires, on peut changer la colère en affection. Une fois acquise cette sorte d'information une simple machine devrait être capable de construire un « modèle » à la fois individuel et fini. Les résultats seraient d'abord grossiers, certes ; mais, ici encore, la moitié du travail consiste à se lancer. Ensuite, une fois que le bébé aurait un modèle de l'Autre, même grossier, il pourrait l'imiter et l'adapter pour commencer à se construire son propre modèle de lui-même.

Pour en revenir à la musique, il paraît tout juste possible que nous disposions, cachées dans les chants et les contextes innocents de nos cultures musicales enfantines, de leçons sur les successions de nos propres états affectifs. Encryptées du point de vue « sentique », ces ballades détiendraient sous forme de codes des instructions concernant la conciliation et l'affection, l'agression et la retraite -- exactement le genre de connaissance des signaux et des états dont nous avons besoin pour vivre avec autrui. Et si c'était le cas, plus tard, dans la vie, des musiques plus complexes pourraient illustrer des cas plus complexes de conflit et de compromis, ainsi que des façons d'associer des finalités pour atteindre plus d'un but à la fois. Enfin, pour les adultes, nos Kubrick pourraient adapter les Neuvièmes Symphonies de Beethoven aux Oranges mécaniques.

Le lecteur trouve-t'il tout cela bien recherché ? Moi aussi. Mais avant de tout rejeter, souvenons-nous du problème : Pourquoi la Musique, et pourquoi la laissons-nous occuper nos vies sans raison apparente ? Quand aucune idée ne paraît juste, l'idée juste doit paraître fausse.

Le thème et l'objet

La Cinquième de Beethoven : quel en est le sujet : est-ce tout simplement ces quatre notes ? Ou bien faut-il y inclure le double, ce pendant transposé ? Et que faire des autres variations, augmentations et inversions ? Procèdent-elles toutes d'un seul prototype ? Dans ce cas, il semble bien que oui.

Mais est-ce si sûr ? Car plus avant dans la symphonie, le thème apparaît sous forme de triolet pour jouer le rôle de contre sujet dans le scherzo. Trois notes plus une, trois notes plus une, trois notes plus une ; et pourtant elles en font quatre. La mélodie se mue en rythme monotone, et le rythme se transforme en deux moitiés égales. L'accent fort tombe maintenant sur un son plein au lieu de tomber sur un demi-soupir. Avec toutes ces différences, les thèmes sont différents, et pourtant toujours les mêmes. Et l'allegro n'est pas non plus le prototype ; distincts mais égaux, ils enjambent le temps musical.

Y-a-t'il donc quelque idée plus abstraite encore logée dans les deux allegros ? Ceci m'évoque le problème posé par Wittgenstein (J) : que signifient des mots comme « jeu ? » J'ai écrit ailleurs (E) que, pour la vision, « chaise » ne se laisse pas réduire à un seul prototype ; il vaut mieux en utiliser plusieurs et les lier par des réseaux de relations d'identité et de différence. Mais, même là, je doute qu'on trouve des représentations satisfaisantes de tout ce qui est sous-jacent à la musique. Il faut donc essayer les outils modernes de la recherche en Intelligence artificielle tels que systèmes de contraintes, dépendance conceptuelle, systèmes d'encadrement et réseaux sémantiques. C'est là que se passent les choses aujourd'hui pour ceux qui tentent de résoudre ce type de problèmes. (A)

Mais obstinément nous cherchons réponse à la question : « Qu'est-ce qu'un bon thème ? » Sans « bon », ce mauvais mot, je ne crois pas que la question serait bien posée -- parce que si tout est musique, tout peut être thème.

Divisons donc cette question en 1) Quelle sorte d'états ou de processus mentaux sont évoqués par les airs qui nous plaisent ? 2) que voulons-nous dire par « qui nous plaisent ? » Questions difficiles, bien sûr, mais la première n'est que difficile -- elle implique beaucoup d'introspection et beaucoup d'expérimentation difficile. Bien.

La seconde question est également difficile, mais très différente : il y a bien longtemps que philosophes et savant s'efforcent de comprendre ce que sont le plaisir et la douleur. J'apprécie particulièrement l'explication que donne Dennett des raisons pour lesquelles c'est si difficile (D). Selon lui, il n'existe pas une entité nommée « douleur », car celle-ci fonctionne de diverses façons selon les moments, et toutes ces façons ont trop peu de caractères communs pour justifier une définition traditionnelle. Je crois qu'il a raison, mais alors, si la douleur n'est pas une seule chose, pourquoi continuons-nous à parler et à penser comme si c'était le cas, et à nous en faire une représentation si trompeusement claire ?

Je prétends que cette « erreur » a une utilité, qui est liée à un problème auquel se heurte toute société -- au-dedans ou au-dehors de l'univers mental --, du moins en tant que l'expérience est censée lui apprendre quelque chose. Ce problème est le suivant : comment attribuer le mérite ou la responsabilité de chaque succès et de chaque échec de la société dans son ensemble quand on sait le nombre considérable d'agents qui sont impliqués dans tout ce qui se produit ? Dans la mesure où les actions de ces agents sont décidées localement, il faut aussi que des décisions d'attribution des responsabilités soient faites localement.

Ce genre de question a une importance considérable. Par exemple, comment une mère pourrait-elle dire que son enfant éprouve un besoin (ou qu'un besoin a été satisfait) avant d'avoir appris les signes spécifiques qui lui communiquent ce besoin ? Ceci pourrait se faire par un processus évolutif : par la collection de signaux en provenance de plusieurs processus internes et différents les uns des autres, mais ayant tous trait aux besoins, et auxquels seraient attribués une seule production commune : les expressions « sentiques » de l'inconfort (ou de la satisfaction) chez l'enfant. Par une harmonie génétiquement préétablie ceci évoquerait, voire susciterait, un état central correspondant chez le parent. Il y aurait là quelque chose de comparable à la détresse qu'on éprouve en entendant un bébé pleurer.

Mais la satisfaction a besoin de signaux, elle aussi. Supposons que, parmi toutes les choses que peut faire un enfant, il en est une que sa mère « aime » particulièrement -- ce qu'elle manifeste en émettant des sons appréciatifs. L'enfant vient de marcher jusque là en tenant cet objet comme ceci ; il a pensé cela, et il a parlé d'une certaine façon. Comment va-t'il pouvoir découvrir mentalement ce qui était « bon ? » L'ennui est que tout ce qu'il vient de faire procède des petits projets qu'il a faits auparavant. On ne peut pas récompenser un acte. Ce qu'on peut récompenser, c'est l'agent qui a choisi cette stratégie, ainsi que l'agent qui a intelligemment motivé cet agent, et ainsi de suite.

Pour ce faire, il faut communiquer à tous ces agents, à tous ces processus un message qu'ils puissent tous utiliser pour estimer leurs projets, leurs stratégies, leurs constructions. Malheureusement, ces divers récepteurs ont si peu en commun que, pour voir la moindre efficacité, untel message doit être exprimé sur le mode de l'extrême simplification. De sorte que « bon » signifie le degré de centralisation qui permet à un précepteur (de l'extérieur ou de l'intérieur) de dire aux membres de la société des agents mentaux que l'un ou plusieurs d'entre eux a fait quelque chose de bon -- quelque chose qui satisfait à un besoin quelconque -- sans avoir a comprendre qui c'est, ni comment, ni même pourquoi.

Nous croyons savoir ce que signifie l'expression « satisfaire » à un « besoin » alors même que chacun des deux mots a plusieurs sens. Il y a cette illusion de substantialité qui nous induit tous à juger tautologique et indigne de réflexion la question « pourquoi aimons-nous le plaisir ? ». Du fait de la pauvreté même du mot et du signe, les niveaux sociaux où nous utilisons des mots aussi gauches qu'« aimer », « bon » ou « on s'est bien amusés » ne peuvent que réduire grossièrement toute une gamme de significations. « Bon » n'est pas un symbole qui signifie, contrairement à « table ». « Bon » est le nom d'une injonction du type : « Activez tous ces processus (inconnus) qui mettent en corrélation, qui trient et qui passent au crible tout ce qui a trait à l'apprentissage, pour que je sache quels changements devraient maintenant être effectués (en moi) ». Quant à « aimer », c'est notre façon de nommer l'acte par lequel nous nous expédions à nous-mêmes de tels signaux constructeurs de structure.

C'est là une des raisons pour lesquelles nous aimons la musique. Aimer une musique, cela signifie seulement la manière dont certains de nos agents mentaux apprennent aux autres ce dont ils ont besoin pour comprendre cette musique. La véritable écoute, c'est ça. D'où aimer (ou détester) est au coeur même de notre compréhension de ce que nous entendons. Les affects et l'esthétique ne se situent pas dans d'autres mondes épistémologiques, dans des mondes auxquels nos théories musicales peuvent tranquillement tourner le dos. Ces mondes séparés ne sont que des illusions académiques soigneusement entretenues afin que nos problèmes paraissent être ceux des autres.

Marvin Minsky
traduit par Emmanuel Gresset


Notes

  1. Je ne veux pas dire qu'il est facile de comprendre l'émotion, mais qu'il est encore plus difficile de comprendre la raison. Il existe dans notre culture un mythe universel qui nous fait percevoir l'émotion comme plus complexe, plus obscure que l'intelligence. Or il est possible que, dans le sens d'une certaine évolution antérieure, l'émotion soit plus « profonde » ; mais ce n'est pas pour cela qu'elle est plus difficile à comprendre. En réalité, je suis persuadé qu'aujourd'hui nous en savons beaucoup plus sur l'émotion que sur la raison. Nous avons, certes, quelques connaissances sur la façon dont fonctionne la raison en surface : sur la façon dont nous organisons et nous représentons les idées que nous recevons, ainsi que sur la façon dont nous les utilisons formellement pour en fabriquer d'autres.
    Mais d'où viennent les idées elles-mêmes, qui viennent si commodèment remplir ces enveloppes d'ordre ? Une certaine pauvreté de langage dit bien le manque d'intérêt que nous portons à ce problème : nous « avons » des idées ; elles nous « viennent » à l'esprit ; nous nous « souvenons », etc. Manifestement, tout cela émerge de profondeurs obscures. Et les gens ne s'en soucient guère, alors que les émotions les ravissent : c'est là un phénomène d'observation courante. Peut être le mythe persiste-t'il parce que les émotions sollicitent naturellement notre attention, alors que les processus inconscients de la raison protègent leur intimité : ils fonctionnent d'autant mieux qu'on les laisse tranquilles.
    En tout cas, ces vieilles distinctions -- l'affect, la raison, l'esthétique sont incontestablement une mauvaise idée. On pourrait les comparer à la Terre, à l'Air et au Feu des alchimistes d'antan. Il nous faut des concepts bien meilleurs pour mettre en oeuvre une chimie du psychisme.

  2. La musique a bien des formes, et il y a bien des façons d'enseigner. Je ne dis pas que Beethoven avait consciemment l'intention d'enseigner, mais, je dis qu'il n'en a pas moins été un maître dans l'art d'inventer des formes pour l'exposition ; et ceci inclut des formes dont l'apparition implique des idées nouvelles, et qui nous obligent à un travail d'autant plus considérable.

  3. Apprendre à reconnaître n'est pas la même chose qu'apprendre par coeur. Notre dispositif mental peut fort bien s'inventer un agent qui aura pour mission de réagir à un certain stimulus et manquer d'un agent qui saura reproduire celui-ci. Comment un tel dispositif fera-t'il pour apprendre que le premier demi-sujet de la Cinquième de Beethoven -- appelons-le « A » -- préfigure le second demi-sujet « B » ? C'est très simple : un agent A qui reconnaît A envoie un message à un autre agent B dont la tâche consiste à reconnaître B. L'effet produit par ce message est d'abaisser le seuil de B, de sorte que B va réagir à des signaux plus petits de B qu'il ne l'aurait fait autrement. Résultat : le dispositif mental s'attend à entendre B après avoir entendu A, c'est-à-dire que pour trouver B, il aura besoin de soins de signes, ou de signes plus subtils ou encore, il se plaindra s'il n'y parvient pas, etc. Et pourtant, ce dispositif ne peut toujours pas reproduire l'un ou l'autre des thèmes, du point de vue génératif. L'argument est qu'il n'est pas nécessaire que les messages interagents soient dans les langages musicaux de surface : ils peuvent fort bien se trouver dans des codes qui conditionnent certains autres agents à se conduire de façons différentes. (Par exemple, B peut envoyer des messages à d'autres agents encore, messages consistant à les prévenir qu'il faut s'attendre à trois répétitions plus rapides, plus nerveuses).

  4. Que ce soit vrai ou faux, on entend souvent dire que les mathématiciens portent un intërêt exceptionnel à la musique, mais que l'inverse n'est pas vrai. (Et ceux qui ne sont dans aucun des ces domaines ajoutent souvent, à notre grand agacement, « naturellement »). Peut-être y-a-t'il en commun le goût de rendre complexes les choses simples. Mais les mathématiques sont peut-être trop contraignantes pour satisfaire à ce goût, alors que la musique, elle, peut être rigoureuse ou libre : elle peut accepter un accompagnement fortuit ou exiger un canon parfait. A la façon dont le jeu mathématique est joué, la plupart des variations restent en dehors des règles. C'est pourquoi les mathématiques risquent d'avoir besoin de la musique, et non le contraire. (Il y a une autre théorie, plus simple : puisque la musique commence à un âge plus tendre, il est possible que certains mathématiciens soient les musiciens-mathématiciens qui nous manquent).

  5. En matière scientifique, on commence toujours par expliquer dans les termes de ce qu'on peut observer : la terre, l'eau, le feu, l'air. Mais lorsque les choses proviennent de processus compliqués, il n'est pas nécessaire que leur nature apparaisse en surface. (La pression constante d'un gaz ne dit pas les innombrables micro-impacts dont elle est composée). Pour parler de ce que représente ou signifie cette chose, il faut parler de la façon dont elle se forme.
    Mais pour ce faire, il nous faut des moyens de décrire les processus. Avant les ordinateurs, aucun langage ne convenait. Piaget avait essayé l'algèbre, Freud les diagrammes, et d'autres psychologues parlaient de chaînes et de matrices markoviennes ; rien de tout cela n'a donné grand chose. Les behavioristes, eux, ont tout bonnement cessé de parler, tandis que les linguistes faisaient foule autour de la syntaxe formelle, et progresseraient pendant quelque temps, mais atteignaient vite une limite : la grammaire transformationnelle révèle les contenus des compteurs (si l'on peut dire), mais elle ne peut pas parler de ce qui les règle. Il en résulte qu'il est difficile de parler de la relation entre le discours de surface et les références et l'intention sous-jacentes c'est encore le problème du bébé et de l'eau du bain. La raison pour laquelle j'apprécie les idées de la recherche en Intelligence artificielle, c'est que là, au moins, on a tendance à se mettre d'abord en quête d'une description des procédures -- et cela me paraît plus pertinent en ce qui concerne le mental.

  6. On peut déjà programmer les ordinateurs pour qu'ils composent de la meilleure musique que la plupart des gens ne peuvent le faire, mais cette musique est encore assez « mauvaise ». Je ne sais trop que penser à ce sujet ; nos critères les plus bas sont si élevés qu'il nous est difficile de distinguer entre premiers progrès et cacophonie.

  7. C'est Edward Fredkin qui m'a suggéré l'idée que, peut-être, l'écoute musicale fait travailler un mécanisme inné comparable à l'activité d'un cartographe. Lorsque je lui parlai de l'énigme du caractère répétitif de la musique, il eut recours à une comparaison avec la façon dont les rongeurs explorent l'espace plusieurs fois de suite, ils s'avançent un peu dans une direction, puis font demi-tour. Puis ils s'enhardissent à aller un peu plus loin, tentent quelques petites digressions, mais ne manquent jamais de retourner fréquemment chez eux. Comme les souris, les hommes explorent de nouveaux territoires de cette façon, en se construisant des cartes mentales pour éviter de se perdre. Il est possible que la musique soit une illustration de ce processus d'élaboration, ou même qu'elle fasse travailler les mêmes organes du dispositif mental.

  8. Tel un citoyen moyen, Constructeur d'espace ne sait rien du fonctionnement de la vue : il n'a jamais entendu parler d'excavation centrale, de tâche aveugle ou de perspective. Il n'y a qu'à l'école qu'on entend parler de tous ces détails : des millénaires d'introspection n'ont pas permis d'en soupçonner l'existence, et la méditation n'en a pas fait plus, même si elle est transcendantale. Le dispositif mental garde bien ses secrets -- non par avarice ni par pudeur, mais parce que, tout simplement, il ne les connaît pas. Ce n'est que depuis quelques siècles que les peintres, grâce à la technique et à l'illusionnisme acquis, ont appris à simuler la réalité. Ils en savent maintenant assez sur ce sujet pour s'orienter vers d'autres horizons.

  9. L'agent dont la tâche est de comprendre la scène n'est pas autonome non plus ; les questions qu'il pose à l'Analyste ne viennent qu'en réponse à des questions posées par d'autres. Dans un tel système, il n'est pas nécessaire de tenir une cause première.

  10. Quelle différence y-a-t'il entre le seul fait de savoir (ou de se souvenir, ou même de retenir) et celui de comprendre ? Nous sommes tous bien d'accord pour dire qu'afin de comprendre quelque chose, il faut savoir ce que cela signifie -- mais nous ne saurions guère en dire plus. Je crois savoir pourquoi il en est ainsi. Une chose ou une idée ne nous paraît signifiante que si nous disposons de plusieurs représentations différentes -- que ce soit des perspectives ou des associations. Alors seulement peut-on, pour ainsi dire, la tourner et la retourner mentalement ; quelle que soit son apparence à un moment donné, on peut toujours l'envisager d'une façon différente ; on n'est jamais pris de court. En d'autres termes, on peut y penser.
    S'il n'y a qu'une et une seule possibilité de l'envisager -- si la chose ou l'idée est simplement là, inactive, dans l'esprit, il n'y a pas pensée à proprement parler. Ainsi, n'a un sens que ce qui en a plusieurs ; ne comprendre que d'une seule manière, c'est ne pas comprendre du tout. C'est pourquoi la quête de la « vraie » signification est vouée à l'échec. Et il en va de même de la compréhension elle-même.

  11. On trouvera dans (H) un bon exemple de la possibilité d'établir des interconnections entre les Découvreurs de traits distinctifs, les Détecteurs de différences et les Constructeurs de structures. Les Preneurs de mesure tomberaient facilement dans la catégorie des cadres telle qu'elle est décrite en (E). Quant à l'idée de « sociétés d'agents mentaux » telle qu'elle est développée en (I), (G) et (F), elle doit beaucoup à Seymour Papert.
    Nous connaissons tous ce que j'appellerai la « rémanence du rythme », c'est-à-dire la persistance du « battement » pendant de courts épisodes ambigus. Je suppose que ce phénomène provient d'une caractéristique fondamentale de la façon dont les agents sont assemblés d'habitude. A chaque niveau plusieurs agents de chaque catégorie se trouvent en rivalité : c'est ainsi que les agents du 3/4, du 4/4 et du 6/8 rivalisent pour trouver la meilleure solution. Mais, une fois en place, les agents n'ont de cesse qu'ils paralysent leurs collègues. C'est ainsi qu'une fois que 3/4 aura pris la direction des opérations, 6/8 se plaindra qu'on ne l'écoute plus, même si les choses s'améliorent un peu pour lui.
    Quand les choses ne s'améliorent pour aucun d'entre eux pendant assez lontemps, cependant, les agents changent au hasard ou bien à tour de rôle. C'est ainsi que, d'une certaine façon, n'importe quoi peut devenir intéressant en devenant monotone. Nous savons tous de quelle manière nous commençons à changer lorsqu'un mot ou une expression est répétée assez longtemps : c'est parce que les infatigables Détecteurs se mettent alors à amplifier des détails infinitésimaux, ou même qu'ils interprètent le bruit comme une structure. Et ceci peut se produire à tous les niveaux : quand les choses sont régulières à l'un de ces niveaux, les Détecteurs de différence vont échouer au suivant, où ils seront remplacés par des renforts qui interpréteront l'identité d'une manière différente. Il en va ainsi de la méditation : quand elle ne subit pas la règle des sphères mentales supérieures, elle se trouve très bien du plus banal des influx inférieurs.

  12. Les théories concernant les enfants ne s'appliquent pas toujours aux adultes ceci est dû -- selon moi, en tout cas -- au fait que les dispositifs mentaux sont tellement portés à l'auto-révision que les choses finissent par se détacher de leurs origines. On peut très bien finir par aimer également l'Art de la fugue et l'Offrande musicale, et ceci principalement parce que le sujet de chacune de ces oeuvres vient éclairer l'autre, y ajoutant ainsi un réseau supplémentaire de « significations ». Et dans ce cas, la circularité dépendante ne doit pas nécessairement être perçue comme un paradoxe, car dans la pensée (au contraire de ce qui se passe en logique), deux objets peuvent très bien se soutenir réciproquement sans le moindre appui. Certes, une autonomie de ce type est précaire : une fois détaché de ses origines, ne risque-t'on pas de suivre d'étranges voies de dérive ? Aucun doute là-dessus c'est pourquoi tant de gens paraissent tout à fait fous -- aux yeux les uns des autres.

  13. Que ce soit l'apprentissage du temps, l'assemblage des objets, l'accoutumance à autrui ou le refoulement de ses problèmes, tous les « usages » de la musique dont je parle ici sembleront très « fonctionnels » dans la mesure où ils paraissent négliger les échelles « d'usage » beaucoup plus larges. C'est Curtis Roads qui m'a fait remarquer qu'« au-dessus de la pure et simple survie, tous les univers sont auto-construits, et des cultures entières ont été construites autour des choses les plus simples : celles que tout le monde apprécie ». Et il est vrai que ce type d« 'appréciation », représentée par des agents esthétiques, finit par jouer un rôle très important dans toutes nos décisions ; par exemple, ce que nous trouvons beau sera lié tôt ou tard à ce que nous pensons important. Et peut-être Roads a-t-il raison de penser que lorsque plusieurs agents mentaux ne peuvent tomber d'accord, ils tendent à déléguer leur pouvoir dérisoire à d'autres agents qui ne sont pas moins concernés, et que nous appelons forme et pertinence esthétiques. Cette délégation de pouvoirs n'aurait qu'un effet minime à chaque stade, mais généralement, ces « appréciations » seraient parfaitement en mesure de façonner un monde.

Remerciements

L'article qui précède tire parti de conversations à bâtons rompus avec Maryann Amacher, John Amuedo, Bernard Greenberg, Betty Dexter, Danny Hillis, Douglas Hofstadter, William Kornfeld, Andor Kovach, David Levitt, Tod Machover, Charlotte Minsky, Curtis Roads, Gloria Rudisch, Frederic Rzewski, Stephen Smoliar. Il est dédié au souvenir d'Irving Fine.

Références

L'érudition n'est pas mon fort, et je prie le lecteur de bien vouloir m'en excuser. Je ne doute pas que les idées exposées ici ont des origines beaucoup plus diverses que celles que je donne ci-dessous. On trouvera de bons compte-rendus des ouvrages récemment consacrés à la cognition musicale dans (A).

  1. Computer Music Journal, vols.4(2), Eté 1980, 4(3), Automne 1980.
  2. Ludwig v. Beethoven. Grosse Fugue, en mi bémol, Op.133.
  3. Clynes, Manfred. Sentics, Doubleday, New York, 1978.
  4. Daniel Dennett, « Why a Machine can't feel Pain », in Brainstorms.
  5. Minsky, Marvin. A Framework for Representing Knowledge, MIT, Artificial Intelligence Laboratory, AI Memo 306, Cambridge, Ma., Juin 1974. Version abrégée dans The Psychology of Computer Vision, sous la direction de P.H. Winston. New York : McGraw-Hill, 1975.
  6. Minsky, Marvin. Jokes and the Logic of the Cognitive Unconscious, MIT, Artificial Intelligence Laboratory, AI Memo 603, Cambridge, Ma., Nov. 80
  7. Minsky, Marvin. « K-lines : A Theory of Memory ». Cognitive Science, Vol.4, No 2 (Avril 1980), 117-133.
  8. Winston, P.H. « Learning Structural Descriptions by Examples ». Psychology of Computer Vision, Sous la direction de P.H. Winston. New York : McGraw-Hill, 1975.
  9. Minsky, Marvin. « Plain Talk About Neurodevelopmental Epistemology ». Proceedings of the Fifth International Joint Conference on Artificial Intelligence, Cambridge, Ma., Août 1977. Version abrégée dans Artificial Intelligence, sous la direction de Winston et Brown, Vol.1, MIT Press, 79.
  10. Wittgenstein, Ludwig. Philosophical Investigation, Oxford 1953

____________________________
Server © IRCAM-CGP, 1996-2008 - file updated on .

____________________________
Serveur © IRCAM-CGP, 1996-2008 - document mis à jour le .