IRCAM - Centre PompidouServeur © IRCAM - CENTRE POMPIDOU 1996-2005.
Tous droits réservés pour tous pays. All rights reserved.

Un studio numérique de travail sur le son

Bénédict Mailliard

Le compositeur et l'ordinateur, Ircam, Paris, 17-21 février 1981
Copyright © Ircam - Centre Georges-Pompidou 1981, 1999


L'important, dans toute tentative d'emploi de l'ordinateur à des fins de musique, est, nous semble-t-il, de mesurer la distance entre le conditionnel et le présent de l'indicatif, qui est ici infinie. Tout autant celle des langages informatiques à la langue, de la lumière électrique à la lumière naturelle.

N'existent en effet, ni les constituants élémentaires du son, ni les phénomènes universels de toute composition musicale. Autrement dit, la seule généralité possible dans ce domaine est celle de l'informatique elle-même, ce qui ne nous avance pas, au sens de l'élaboration. La ville la plus générale est de même le désert, quand elle est encore dans l'esprit des hommes. Sitôt construite, elle a ses rues et ses maisons, soit ses chemins et ses murs.

On en revient donc à Pascal, non pour désespérer, mais pour délimiter la place de l'ordinateur dans telle optique. Le rôle du langage est ainsi d'hypothèse.

Et, en définitive, tous, parmi les architectes de ces villes, le pensent bien ainsi, comme ceux qui la pratiquent, les musiciens par le fait.

De nombreux projets d'informatique musicale sont donc possibles. L'INA-GRM est le lieu de l'un d'entre-eux, et en cela, il a lui aussi ses partis, soit ses principes et ses visées, déterminés par la tradition des méthodes de confection qu'il représente et la situation d'ensemble de ses acteurs.

On en donne ici une description, avec des exemples, pour en faire connaître les hypothèses, les propriétés et les interrogations.

Dans sa passion pour la matière formée du son, ses mouvements donnés, quoique choisis, comme autant de propositions musicales à travailler, la musique sur bande a induit des attitudes démarquées face à la réalisation, et donc aussi l'invention. Comme autant de mots aux verbes implicites, à déterminer pour former la phrase. De cela nous considérons ici, non l'esprit qui s'y meut, mais la méthode qui lui donne échelle : ce par quoi les formules (sonores) viennent à l'oeuvre, se lient, poursuivent et pensent, dans la façon.

L'important sera, comme de toute méthode, qu'elle définit une oreille, soit des équivalences entre les sons (que tel et tel, au sens de telle oeuvre, sont substituables), et des lignes de portée.

C'est qu'il s'agit, non nécessairement de formaliser, mais de ménager et favoriser. Il s'agit ainsi d'un studio informatique de travail sur le son, (à prendre maintenant comme ensemble arbitraire : à l'unité strictement opératoire, d'évènements audibles), de même mesure qu'un studio classique de composition électroacoustique (*). L'esprit qui préside à sa conception y est semblable, ménageant la même attitude de travail. Comme aux premiers temps, il est largement expérimental, en tous les sens.

C'est un studio : les programmes forment un ensemble cohérent, aux éléments compatibles, connectables en un certain sens, aux conventions unifiées. C'est du moins la tentative. L'objet universel y est le fichier d'échantillons sonores, comme au studio le bobino de bande.

Il est relié électriquement aux studios électroniques voisins.

Les utilisateurs ne sont censés avoir aucune connaissance informatique, aucune formation en ce sens ne leur est dispensée, excepté le minimum nécessaire à l'emploi des terminaux et des programmes existants. L'expérience a même exclu de la formation standard les codes symboliques d'assemblage, type Music V, pourtant opérationnel à qui veut.

Cette position n'est pas de dogme, mais de continuité. Ces choses étant encore à construire, par le fait, il n'est pas impossible que la base pédagogique évolue avec l'expérience de leurs sujets : on en aura ainsi les degrés.

La conséquence en est que tous les programmes sont conversationnels : chaque programme propose, par des questions sur le terminal, des options à choisir et des données (valeur, courbes, ou sons) à fournir. Le résultat de chaque programme, disons la sortie, peut être, s'il y a lieu, utilisé en entrée de tout autre, soit comme source, soit, avant détection, comme commande.

Ce studio, dans une première étape, travaille en temps différé, les programmes de lecture (écoute) et enregistrement du son exceptés, et l'accent est mis sur le traitement de données plus que sur la génération, ici moins développée, pour des raisons de continuité de pratique, et parce que la génération, embrassant avec indifférence le microscopique comme le macroscopique, pose, vis à vis de l'orientation présente, des problèmes plus aigus de code d'assemblage. Aussi bien, la transformation de sons concrets est, comme on sait, une riche méthode de synthèse.

Dans cette voie, on a commencé par traduire les opérations classiques du studio, qui se trouvent, par la simple substitution des technologies, déplacer leurs effets.

On dispose ainsi d'un éditeur de son (montage et micro-montage en temps semi-réel), d'un programme de mélange (mais non de mixage), réverbération, variateur de vitesse, modulateur en anneau, modulateur de phase, modulateur d'amplitude et de forme, modulateurs en formants par filtres inconditionnellement variables, banc de filtres résonnants, étirement et contraction des matières, vocoders généralisés (sources analytique et modulante quelconques) par filtres et par prédiction linéaire, brassage des matières.

Tous ces programmes sont diversement instrumentés, munis de commandes par détection ou génération interne, correlés ou non. Ce sont des boîtes noires, à fonction et variation limitées. Il n'y a pas de programme assurant la combinatoire de ceux-ci. Cependant, toutes les combinaisons sont possibles, manuellement, en quelque sorte.

En exemple, on en décrit trois, afin de montrer leur formule concrète, et rendre sensible leur pratique. Les filtres digitaux acceptent des coefficients de sur-tension très élevés ; ils rentrent alors en résonnance, celle-ci pouvant durer plusieurs secondes. Cette propriété a été utilisée.

Le programme propose un banc de filtres, d'ordre deux (filtrage partiel) ou quatre (filtrage fort), en nombre inférieur à 50.

Lorsque les filtres sont réglés en résonnance, le programme fonctionne à la façon d'une harpe éolienne. Un son source, qui joue le rôle du vent, envoyé à travers le banc de filtres, le jeu de cordes, à hauteurs fixes, les fait résonner en accord avec ses propres énergies spectrales : on entend s'arpéger les hauteurs suivant le mouvement spectral et dynamique de la source. La morphologie du son et ses tessitures sont conservées, transportées sur une gamme de hauteurs fixes.

Sont à choisir, le nombre de filtres et la fenêtre spectrale qu'ils occupent ; ils sont alors automatiquement répartis de façon à l'occuper par intervalles constants. Le coefficient de surtension, à préciser, est constant et identique pour tous les filtres. On peut choisir individuellement le gain de chaque filtre. Tous ces paramètres demeurent constants.

Si l'on désire obtenir des actions indépendantes sur plusieurs régions spectrales, on opère plusieurs traitements, que l'on mélange ensuite, digitalement, donc de manière parfaitement synchrone. Le son produit est lisse (accord de sinusoïdes à fréquences fixes) à l'harmonie constante. Si on trouve cette propriété trop signalée, d'autres traitements la modifieront.

Peut-être d'autres répartitions des filtres devraient-elles être offertes.

On pourrait envisager de ménager des possibilités de variations. Aucune ne s'est pourtant encore imposée : l'arbitraire total est impraticable, vu le nombre de paramètres ; sinon, il faudrait des lois, mais aucune n'a de réelle nécessité.

La meilleure amélioration sera sans doute, si on trouve un moyen acceptable de la détecter, de corréler la largeur de la fenêtre spectrale.

Le programme travaille sur deux fichiers-son, un en entrée, dans lequel il prélève ses éléments, un autre en sortie, non nécessairement vide, dans lequel il accumule les résultats de ses opérations. L'unité est le segment temporel.

Un segment peut être repéré, d'oreille, dans le fichier d'entrée, et isolé. Il est ensuite loisible, soit de le coller à la suite des précédents, soit de le substituer à un segment quelconque, de même durée, du fichier résultat, soit de l'intercaler à un endroit quelconque de la sortie, en lui faisant la place nécessaire sans rien effacer, soit enfin de le mélanger, à un endroit arbitraire, à la sortie.

Dans tous les conversationnels, les questions apparaissent séquentiellement selon l'arbre des choix, avant l'exécution, censée avoir lieu une seule fois par cession.

La procédure est ici différente. Apparaît sur l'écran alphanumérique un cadre en trois parties : la première contient des renseignements sur les fichiers (entête) ; la troisième est un mémento rappelant les fonctions, activées par pression d'une touche symbolique du clavier ; la seconde contient des compteurs numérotés, définissant les paramètres.

Le curseur de l'écran est susceptible de se déplacer sur l'écran et de se mettre en position sur chaque compteur : la pression de la touche 7 l'amène sur le compteur numéro 7. La pression de la touche + (ou -), l'incrémente (ou le décrémente) par pas de 5 millisecondes pour le temps, de 5 centièmes de db pour les énergies.

Un petit mécanisme a été prévu, en sorte que, la touche + étant maintenue pressée, le compteur s'incrémente de plus en plus vite, simulant en somme les facultés de rembobinage, lent ou rapide, des magnétophones. Les montages se font avec un « collant  », non limité en durée, les mixages, en fondu enchaîné. Chaque segment peut être entendu en temps réel, le résultat aussi, par pression des touches attribuées. On peut naturellement changer de fichiers en cours de cession.

Plus brièvement, un dernier exemple. On découpe des petits fragments dans le son, selon une loi variable entre l'identique et l'aléatoire, et on les remélange, suivant une autre. On obtient ainsi une « température  », soit un degré d'agitation, agissant comme on veut sur le microscopique ou le macroscopique (ou les deux). Tous les paramètres peuvent varier par segments linéaires. Par diffraction, de nouvelles matières sont ainsi formées, qui peuvent ou non, au choix des échelles, conserver la morphologie source. Ce qui reste de la structure harmonique est le mode.

De même que la musique électroacoustique a renversé la pratique de l'organisation par rapport au matériau, suspendant jusqu'au bout la conception, alors manuelle, et privilégiant la position d'artisan, de même est renversé l'abord de l'ordinateur. Au lieu d'être dans la position d'imaginer et concevoir les dispositifs répondant à son sentiment musical, le compositeur se trouve en face d'instruments de manipulation, dont il doit apprendre, par l'expérimentation, les propriétés.

L'ordinateur n'a pas de mesure, ses opérations élémentaires sont infiniment petites, ses possibilités infiniment étendues. La vraie mesure de son emploi est celle de ses programmes. Or quelle est-elle? Ces programmes n'étant pas généraux, ni complètement particuliers, sauf à n'être utilisables qu'une fois.

Comme dans toute entreprise semblable, on demande qu'ils soient à la mesure de l'oreille à laquelle ils se prêtent, c'est-à-dire, à la mesure des opérations majeures de la méthode.

Ces programmes, nous les appelons instruments. Le terme est prématuré : on n'a pas atteint dans ce domaine la maîtrise des luthiers d'autrefois, ni leur art ; excessif : on les fait résonner seulement, un coup modulé après l'autre, longues ou courtes respirations, les écoutant avec attention, comme on accorde ; déplacé : leur place dans la méthode est spécifique.

L'approche est fonctionnelle et donne une ébauche de définition. On exige d'un instrument (de transformation, ou génération, ou les deux) une fonction claire et bien circonscrite, qui définisse un bassin sonore, une vallée aux versants naturels ; même si elle agit, par nature, avec une clarté inégale sur les uns et les autres sons. Il faut qu'un instrument définisse un ordre d'action et d'effet, applicable, sinon vrai, dans tous les cas de figure, et qu'il s'y tienne. Ce n'est donc pas un simple procédé ou ensemble de tels, mais une construction dans laquelle cohérence et solidité sont nécessaires. C'est la condition pour que son emploi soit pensable, de disposer d'une capacité de prédiction, dans un certain plan (d'invariance). La fonction sera alors une combinaison de ce que les procédés prévoient et de ce que la construction produit. Une direction est ainsi donnée, c'est sa part de silence, que la matière d'entrée, le mouvement d'archet ou de respiration, si l'on préfère, ramifiera de ses particularités. C'est pourquoi il conviendra de calibrer les transformations infinitésimales, et parfois d'imposer des liaisons (corrélations) pour ne pas laisser verser les espaces. Plusieurs liaisons légitimes proposent plusieurs options ou se séparent en plusieurs instruments. Parfois une serait à trouver, mais manque. De l'instrument, c'est la propriété caractéristique.

Une telle opération étant donnée, viennent des paramètres, les valeurs de l'action. Il convient de les traduire, de les rendre parallèles à leurs effets de conjugaison, de les mettre à l'échelle. Dès lors, on demande la capacité de se déplacer dans la vallée, la parcourir, profiter de ses pentes pour profiler une forme ou une figure : l'ouverture du bassin en chemins. C'est que la source demande à être suivie, le chemin accordé à elle, là où le dispositif ne s'en charge pas (commandes par détections). Cependant, les variations, parce qu'elles autorisent avec indifférence autant de génitifs que l'on veut, sont limitées, lorsque proposées, à un seul niveau, parfois complexe. Ces grandeurs, nous les appelons paramètres instrumentaux, qui sont une synthèse et réduction des variables d'action.

Enfin apparaissent les coefficients de l'édifice qui donnent les marges. Ce sont des constantes, le bois dont est fait l'objet, et ses dimensions, finalement : ses registres.

Sans doute ces distinctions sont-elles arbitraires, et souvent substituables, n'ont pas plus de nécessité que nous autres. L'important est moins, en fait, le choix de tel plan, qui devra être jugé sous d'autres formes, que les découpage et sélection en niveaux opératoires par eux-mêmes séparés.

Aussi bien, c'est ce qu'on constate, les dispositifs qui ne vérifient pas ces conditions sont inemployables. Le travail dans ce studio se fait en temps différé. C'est dommage, et de cela on s'occupe. Pourtant il faut souligner que les privilèges du temps réel ne sont que de balance par rapport au différé.

Temps réel signifie que l'on entend le son dans le temps qu'il se construit. L'oreille y est actuelle, ainsi que la main et le reste. Est donc offert le jeu proprement dit et son cortège d'indicible, d'informulable, précieux au senti, soit en direct (live), soit dans la retraite du studio. Ainsi sont promis les accords, les ajustements, non par formule, mais par oreille, et avec eux les trajets précis sur les frontières. L'exploration aventureuse retrouve ses droits immédiats.

Les dispositifs temps réel subissent la loi de leur temps de cycle, mais aussi celle de leur propre organisation : il y a toujours, derrière les éléments en-temps, comme en fondation, une structure hors-temps, qui est plus que des racines, mais l'arbre tout entier, et le temps réel, les saisons.

L'expérience constate d'ailleurs que ce n'est pas l'action proprement dite d'un dispositif qui pose des difficultés de conception et organisation, mais bien la structure de commande, celle qui transforme les paramètres d'action en paramètres instrumentaux, libère le champ des mouvements, des interruptions, commutations, mémoire et retour. Car, bien qu'agissant à un rythme considérablement moindre que les opérations de matière, c'est dans la structure qui rend isomorphes la main, l'oreille, et la pensée directe que se trouvent les rameaux les plus nombreux et imbriqués.

En ce sens temps différé n'est pas la version amoindrie et tronquée de temps réel, il en est l'épreuve.

Bénédict Mailliard

Equipe :
J.F.Allouis, J.Y.Bernier, Y.Ceslin, B.Mailliard, D. Valette.
Citons aussi : P.A. Jaffrennou, J.P. Toulier.

____________________________
Server © IRCAM-CGP, 1996-2008 - file updated on .

____________________________
Serveur © IRCAM-CGP, 1996-2008 - document mis à jour le .