Serveur © IRCAM - CENTRE POMPIDOU 1996-2005. Tous droits réservés pour tous pays. All rights reserved. |
Rapport Ircam 29/80, 1980
Copyright © Ircam - Centre Georges-Pompidou 1998
Ce travail de présentation est naturellement décalé dans le temps par rapport à l'activité des chercheurs. Le présent rapport fait donc le bilan des travaux poursuivis à l'IRCAM en 1979, tant par les membres permanents de l'Institut que par les nombreux invités attirés par le potentiel technologique exceptionnel réuni à cet endroit.
On notera aussi que les moyens techniques de l'IRCAM ont été mis à la disposition de plusieurs équipes extérieures, comme celle animée par le compositeur Pierre Barbaud à l'IRIA ou les chercheurs du Département d'Informatique de l'Université de Vincennes. Une collaboration s'est aussi établie avec le Laboratoire d'Acoustique de Paris VI et le Laboratoire de Mécanique et d'Acoustique du C.N.R.S. à Marseille.
Au niveau du matériel, l'IRCAM est en train de doter son PDP10 d'une mémoire de swapping en circuits intégrés afin d'accélérer les temps de calculs en temps partagé ; dans le même ordre d'idées, une unité d'accès direct à la mémoire, en cours de réalisation, permettra d'échantillonner des signaux sonores directement sur le PDP10 ; le même dispositif pourra prendre en charge l'imprimante électrostatique VERSATEC soulageant ainsi l'utilisation du PDP11/40 et le libérant pour d'autres usages. Ces deux unités, conçues et réalisées à l'IRCAM, ont eu leurs cartes électroniques réalisées en 1979 et sont maintenant en cours de montage. Afin de soulager les unités graphiques des PDP11, il a été mis au point en 1979 une carte qui, adjointe aux terminaux standard du PDP10, permet de satisfaire la grande majorité des utilisateurs sur le plan des sorties graphiques. Un terminal utilise déjà ce dispositif qui sera généralisé dans les prochains mois.
Dans le domaine de la programmation, il faut noter les améliorations constantes apportées au système d'exploitation (6 & 27} ainsi qu'aux produits programmes utilisés à l'IRCAM. En outre, les modifications apportées au matériel nécessitent des modifications de programmes correspondantes afin que l'ensemble reste homogène. Les opérations qui ont été menées dans ce cadre sont aussi nombreuses que variées. Nous nous contenterons de citer ici celles qui ont fonctionnellement amélioré l'exploitation du parc de machines de l'IRCAM. Indépendamment des extensions de MUSIC V faites en permanence, on doit souligner le développement d'une version FORTRAN de ce produit afin de le rendre transportable (27). Des programmes de sortie graphique sur les terminaux standard de l'IRCAM, les programmes d'entrées/sorties sonores sur PDP11, l'implantation de MUSIC11 sur le PDP11/34, les améliorations apportées aux programmes SCORE et MUSIC10 etc... ; Il convient d'ajouter à ce travail l'énorme travail de documentation qui a été accompli en 1979 afin que les utilisateurs aient un maximum d'autonomie (36). Toutefois, malgré cet effort, le personnel scientifique et technique de l'IRCAM a passé une part non négligeable de son temps de travail à une assistance technique auprès des utilisateurs.
En même temps, plusieurs directions étaient explorées dans le domaine de la programmation de la 4C. Une première équipe s'est consacrée à une étude systématique des possibilités sonores et musicales de la machine ; ces études concernant aussi bien la recherche de timbres nouveaux que la synthèse de timbres instrumentaux ; le domaine de la simulation de la voix a été largement exploré en utilisant des techniques de filtrage digital sur la 4C. Une seconde équipe a développé un système à haut degré de sophistication en ce qui concerne le dialogue de la machine avec son utilisateur-musicien. Une troisième équipe enfin s'est penchée sur le problème du couplage de la 4C avec un micro-ordinateur, ainsi que la possibilité, pour un public non averti, de manipuler la machine à travers un langage "presse-bouton" très simple permettant une sorte d'auto-apprentissage par l'utilisateur (5, 19, 23).
Une première recherche a été menée en utilisant un "instrument" programmé en MUSIC10 fonctionnant en modulation de fréquence et usant largement des possibilités de contrôle que procure l'emploi d'une telle technique ; on a ainsi obtenu des voix chantées d'une qualité remarquable. Le fait d'avoir employé une méthode reposant sur l'emploi de produits standard sans aucune modification de programmation rend ces résultats particulièrement intéressants sur le plan de leur transposition à d'autres systèmes.
Une autre recherche dans ce domaine a utilisé des techniques de filtrage par simulation de la mécanique de l'appareil vocal ; cette méthode, implémentée sur la machine 4C, bien que ne donnant encore que des vocalisations plutôt que des voix, a permis de mettre au point des synthèses croisées qui n'étaient possibles qu'en utilisant des programmes en temps différé ; on peut ainsi dorénavant employer ce type de synthèse en direct pendant un concert.
Le troisième type de synthèse vocale est la synthèse par formants, déjà étudiée à l'IRCAM depuis 1978 (8, 12). Cette méthode, donnant des synthèses d'une qualité extraordinaire, a permis d'obtenir dès cette année des résultats musicalement significatifs reposant sur une analyse d'un signal réel décomposé en formants (réponse du système à une période du signal excitateur) ; cette méthode est bien entendu applicable à tout type de système résonateur. En plus de la résolution de problèmes de synthèse vocale proprement dite, un logiciel spécialisé a été développé pour traiter ce type de signaux sonores (JUNIOR) ; commencé en 1978, ce logiciel est maintenant achevé (13) ; cette étude a été financée en grande partie par la DGRST (35). Un des grands intérêts de cette technique est que l'on peut s'affranchir aisément de tous les problèmes liés aux "imperfections" des résonateurs réels ; ainsi, à partir de l'analyse d'un son, on peut en extraire les composants fondamentaux de son timbre et resynthétiser d'autres sons utilisant les mêmes caractéristiques.
On doit aussi mentionner pour l'année 1979 un certain nombre de projets qui, bien qu'ayant eu un caractère beaucoup plus ponctuel dans le temps (entre 3 et 6 mois), ont permis à l'IRCAM d'accroître son potentiel technique.
A cet effet un montage expérimental de mesure de l'impédance acoustique d'un tuyau a été développé à l'IRCAM. La mesure de la fonction de transfert T(f) entre le spectre à l'endroit où il est généré (embouchure) et le spectre à la sortie de l'instrument (pavillon, trous latéraux) permet ainsi de reproduire un spectre plus "vrai".
A titre d'exemple, on peut citer plusieurs phénomènes mis en évidence avec ce dispositif expérimental :
Outre ces mesures de qualification du dispositif, celui-ci a été utilisé pour une étude sur les sourdines du tuba et du trombone.
Les sourdines agissent comme une fermeture des tuyaux par une impédance différente du tuyau ouvert. Et si on leur demande de modifier le timbre de l'instrument, on exige en revanche que la tablature de l'instrument ne soit pas modifiée (sourdines transpositrices). Des résultats intéressants ont déjà été obtenus, pour ce sujet de recherche qui continuera en 1980, mais on a mis en évidence l'interaction étroite entre la sourdine et le pavillon. Par exemple, la sourdine agirait comme un remplacement du pavillon pour les instruments "coniques" (tuba), alors que pour les instruments "hyperboliques" (trombone, trompette) l'interaction pavillon/sourdine serait beaucoup plus forte. Or, si l'on connaît assez bien le comportement des embouchures et du tuyau, on manque à l'heure actuelle de connaissances théoriques sur le rayonnement au niveau des pavillons. Ce qui explique la difficulté de compréhension du mécanisme pour les instruments "hyperboliques".
Ce même équipement a été utilisé par plusieurs étudiants de troisième cycle, pour des mesures impossibles à réaliser dans leur laboratoire d'origine, et que l'IRCAM a accueillis pour la circonstance.
Un deuxième thème de travail sur les instruments a porté sur l'émission des sons multiples par des instruments réputés monophoniques, les "multiphoniques". La flûte émettant un signal plus "simple" que les autres instruments, c'est sur cet instrument qu'ont porté les premières études. Soit sur la flûte à bec (2), soit sur la flûte traversière (11), le processus opératoire a consisté à analyser des sons par sonagramme, et par transformées de Fourrier. Une deuxième technique a consisté à resynthétiser, grâce à l'ordinateur, des sons multiphoniques incomplets et à vérifier la distorsion perceptive ainsi introduite. Au cours de ces expériences, étendues aussi à la clarinette, au hautbois et au basson, ont été mises en évidence quelques particularités propres à la perception des sons non harmoniques. Ce domaine est fort mal connu, car les études antérieures ont porté surtout sur des sons "musicaux" traditionnels ou sur des sons sinusoidaux. On a donc cherché à cerner certains phénomènes comme les sons différentiels ou additionnels, les battements. Un effet particulier propre aux sons multiphoniques a été mis en évidence ; il s'agit de "roulement" (modulation d'amplitude de quelques composantes, synchrones) apparaissant comme une transition entre deux états instables (11).
L'approche du phénomène des sons multiphoniques permet d'entrevoir une possibilité de classification des sons multiphoniques basée sur les particularités perceptives du récepteur humain.
D'une part, sur la physiologie du chant, en l'occurrence sur les vibrations de la cage thoracique des chanteurs (43). Il a été démontré que les vibrations induites essentiellement par la pression subglottale, avoisinent le seuil de perception des vibrations à la fréquence de 300 Hz, et donc qu'un chanteur mâle pourrait utiliser cette sensation de vibration de sa cage thoracique comme signal de rétroaction (non-auditif) pour le contrôle phonatoire.
Une autre série d'expériences a été conduite en mélangeant l'air expiré normalement avec un cocktail gazeux dont la célérité acoustique était supérieure à l'air. Ceci afin d'éloigner le premier formant de sa proximité avec le fondamental lorsque les chanteurs chantent de façon à ce qu'ils soient proches en fréquence. Les résultats suggèrent que dans ces conditions, le couplage entre le conduit vocal et la source a un effet marqué sur la fréquence fondamentale pour les voix d'hommes chantées dans l'aigu dans le registre modal alors que le couplage a un effet négligeable pour les voix de femmes dans l'aigu et pour les voix de fausset. Il est vraisemblable que c'est une différence dans l'amortissement de la fréquence du premier formant qui est la cause de cette différence dans le couplage (42).
D'autre part, une collaboration étroite entre un spécialiste de la voix chantée et les chercheurs travaillant sur la synthèse de la voix a permis une évolution amplifiée de cette étude, nommément par les définitions précises des voyelles par formants, des différences entre voix masculine et féminine, des corrélats physiques de l'effort corporel qu'utilise un chanteur, ainsi que des différents registres utilisés dans le chant.
Une étude plus satellite portait sur la typologie des voix chantées en rapport avec la forme de la cage thoracique et les cavités buccales. Ainsi des relevés de mesures corporelles (crâne et visage), des moulages des dents et du palais et des mesures tomographiques (examen des régions vélaires, du pharynx et du larynx) ont été corrélés avec des analyses spectrales. Les relations de cette étude avec des problèmes musicaux étant apparues assez lâches, elle ne sera pas poursuivie plus avant (19).
Malgré tout, plusieurs campagnes de mesure ont été conduites, certaines pour une meilleure connaissance de l'acoustique du lieu, en particulier pour expliquer l'impossibilité d'obtenir un temps de réverbération suffisamment long aux basses fréquences. Il est ainsi apparu que la raison en était essentiellement due au vibrations des panneaux métalliques, dont la masse même alourdie par l'aquaplast (matériau visco-élastique anti-vibratile) reste insuffisante. Il ne semble pas possible de remédier à ce problème de façon simple. Il convient toutefois de noter que le phénomène n'est sensible qu'au-delà de deux secondes pour la durée de réverbération et pour des fréquences inférieures à 250 Hz.
Une deuxième série de mesure avait pour but de mesurer la durée de réverbération dans différentes conditions de température et d'hygrométrie, qui sont deux paramètres sensibles dans les salles de concert actuelles. Ces mesures effectuées courant décembre sont en cours de dépouillement.
Grâce à un financement de la DGRST, nous avons pu entreprendre une étude esthétique du shakuhachi. Le shakuhachi est une flûte japonaise traditionnelle. L'étude était concentrée sur deux structures musique écrite/non-écrite et musique publique/non-publique.
La musique du shakuhachi est, à l'instar de la plupart des musiques japonaises, non-écrite et non-publique, alors que la musique occidentale a été jusqu'aux périodes les plus récentes, écrite et publique. De nouveaux développements particulièrement technologiques, ont rendu de plus en plus questionnables les distinctions entre "texte" et "interprétation", alors que le progrès social a repoussé la musique d'avant-garde, qui occupait une position dominante au 19e siècle, dans un coin de la conscience de la société. Ainsi, la musique contemporaine semble montrer une tendance à devenir partiellement non-écrite et non-publique. Une comparaison entre l'évolution du shakuhachi et sa littérature d'une part, et la culture musicale occidentale peut aussi éclairer les changements survenus dans notre musique (14).
Une recherche plus musicologique a été conduite à propos de la musique de Pierre Boulez. Les résultats de l'étude de l'organisation sérielle de cette musique, par exemple l'interconnection entre les quatre paramètres de hauteur, durée, timbre, et dynamique, permet une meilleure compréhension de l'exploitation possible des nouvelles ressources technologiques dans les compositions de Pierre Boulez.
L'étude de la structure des sons inharmoniques et leur utilisation compositionnelle est un chemin fondamental de la recherche musicale à l'IRCAM, pour lequel a été établi un document de synthèse regroupant tous les travaux entrepris à l'IRCAM sur ce sujet.
Grâce à des expériences avec des exemples musicaux traditionnels, pour lesquels les spectres de chaque harmonique étaient transformés par affinité sur l'axe logarithmique des fréquences, alors que la ligne mélodique était maintenue conforme à l'original, on a exploré les contrastes consonances/disonances des sons inharmoniques. On a constaté que, avec cette affinité des harmoniques, on perd rapidement la perception des accords de hauteurs distinctes, remplacée par une sorte de succession de timbres. Mais on arrive facilement à rétablir la perception de la mélodie originale. On remarque que les sons inharmoniques sont moins stables et fusionnés que les sons harmoniques, aussi des études plus avancées devront être entreprises sur la fusion des partiels dans les sons inharmoniques avant qu'ils puissent être utilisés dans des contextes musicaux cohérents.
Suivant ces idées, un langage de description des relations inharmoniques a été établi. Ce système permet la construction aisée des "pseudo-intervalles" étirés ou compressés. Ceci donne des structures inharmoniques basées sur des règles rationnelles : les proportions du rapport de la série harmonique. Le compositeur peut utiliser ce programme pour transposer, inverser, modifier les structures non-harmoniques qu'il a créées. Cet outil a permis une étude sur la perception des sons inharmoniques ayant des partiels communs et les rapports de consonance et dissonance ainsi induits.
Étude musicologique, mais aussi étude spécifique ; il a été procédé à l'analyse de la pièce "Inharmonique" de Jean-Claude Risset, en particulier des différents instruments utilisés pour cette composition.
(G. HAIR : auditeur aux cours théoriques).
Pièce écrite pour baryton, cinq instruments et bande magnétique. Le texte vient d'un poème de Holderlin. La bande a été réalisée essentiellement par ordinateur à l'IRCAM et constituée en partie des fragments parlés, et de passages chantés par une voix irréelle, synthétisée par ordinateur, en contrepoint avec la voix du chanteur sur scène. Cette voix irréelle a été produite entièrement par programme, sur l'ordinateur à usage général de l'IRCAM.
L'oeuvre est constituée de quatre parties qui s'enchevêtrent :
"CASTA DIVA" a été produit et réalisé par l'IRCAM en association avec Antenne 2, les Spectacles A.L.A.P. Lumbroso et la Fondation du Japon. La musique a été conçue pour quatre musiciens sur scène et deux bandes magnétiques indépendantes dont l'une sort de la "machine". Cette bande se compose de matériaux très divers mixés constamment entre aux et aux instruments sur scène : orchestre ou solistes préenregistrés (par l'Ensemble InterContemporain), sons d'origine concrète, vocale ou synthétique "normale" ; et aussi de nombreux matériaux calculés par l'ordinateur de l'IRCAM avec le programme MUSIC V. Les parties du texte préenregistrées sont soit normales, soit profondément transformées dans l'ordinateur. Ces programmes très sophistiqués permettent de créer par ordinateur des voix parlées ou chantées et de les "travailler" dans le sens voulu par la musique en en modifiant, par exemple, la hauteur, la vitesse et le timbre.
____________________________
Server © IRCAM-CGP, 1996-2008 - file updated on .
____________________________
Serveur © IRCAM-CGP, 1996-2008 - document mis à jour le .