Le Synthétiseur, l’Échantillonneur, les Instruments Virtuels
PART ONE : le synthétiseur
Préambule
Le synthé est un instrument de musique à part entière.
Il peut générer des sons magnifiques et d’autant plus intéressants qu’aucun instrument conventionnel ne peut les reproduire.
Il a fallu la passion et l’ingéniosité d’ingénieurs de talent tels que Robert Moog pour que toute la musique populaire en soit à jamais façonnée.
Pour créer l’alchimie entre l’ingénieur, les bruits étranges que produisaient leur nouvelles machines et la musique, il a fallu que des musiciens doués et curieux s’y intéressent de près : Keith Emerson, Walter/Wendy Carlos, Klaus Schulze, Suzanne Ciani, Vangelis, Doris Norton, Edgar Froese, Jean-Michel Jarre, etc.

Moog, l’ancêtre
Dans les années quatre-vingt sont apparus les échantillonneurs, dont nous expliquons le principe plus loin et qui ont permis de se rapprocher encore plus du « véritable son de l’instrument » que les synthétiseurs.
Dans un premier temps réservées aux gros studios et aux vedettes en regard de leur prix démesuré, certains constructeurs ont toutefois rapidement démocratisé ces machines et leur utilisation s’est alors étendue dans la plupart des productions discographiques.

FAIRLIGHT Qasar, le prix d’une maison en Australie
L’état actuel de la technique de l’échantillonnage et la puissance toujours accrue des ordinateurs permettent aujourd’hui de créer des simulations de toutes sortes de sons. Par exemple, il est possible d’avoir au bout des doigts de véritables orchestres symphoniques virtuels au moyen d’insérables ou plug-ins à intégrer dans un *séquenceur. Mais ce que l’on appelle les instruments virtuels sous forme d’insérables permet aussi d’émuler de manière quasiment clonique les « vieux » synthés des années passées, l’avantage par rapport au synthé étant que les programmes en question sont relativement bon marché, pas du tout encombrants, sans fils et qu’ils ne tombent pas en panne (sauf en cas de plantage de l’ordinateur).
* Programme d’ordinateur dont se sert le compositeur, faisant office de magnétophone multipistes « intelligent »
Il faut quand même savoir que la réalisation finale prend du temps ; on ne programme pas la musique symphonique pour son projet hollywoodien en quinze minutes et les musiciens ne travaillent pas gratuitement. Même les sons de synthé doivent être retravaillés et il est rare qu’un bon producteur se contente des sons d’usine.
Un petit truc de métier : quelquefois, il est plus simple de faire enregistrer son score symphonique par un véritable orchestre plutôt que par 8Dio, VSL, Eastwest et consorts. Quand on sait le temps qu’il faut pour placer les bonnes articulations, les bonnes nuances, les bons samples (courts, longs ? Attaque ou pas ? Mais où sont passés les spiccatos ?), il vaut mieux passer le reste de la semaine à composer sans se prendre la tête à programmer.
Oui, mais qui va enregistrer mon score pendant ce temps là ?
Eh bien, il m’est arrivé de l’envoyer à Los Angeles, ou d’aller directement enregistrer en Roumanie ou en Slovaquie. $ 8000 dans le premier cas, environ 4000 € dans le second cas.

Eastwest Studios
Pour en revenir aux synthés, outre leur talent, les connaissances techniques des musiciens doivent donc être très développées. L’étude qui va suivre est donc très technique. La majorité des termes liés au synthé sont les initiales de mots anglais, et l’auteur vous prie de l’en excuser ; mais une grande partie de ces noms n’a pas de réelle équivalence en français, et de plus, ils sont tous connus des synthésistes.
Le synthé est un instrument capable de créer tant des sons musicaux que des effets ou des bruitages.
Le son
Le son correspond à une variation de pression de l’air ambiant (mise en mouvement de particules dans un milieu considéré comme plus ou moins stable tel l’air, l’eau, le béton armé, etc.).
Notre oreille définit des sons plus ou moins complexes situés entre l’infragrave (20 hertz) et l’ultrason (20 000 hertz).
Le hertz est l’unité de mesure de fréquence d’un phénomène périodique. Symbole : Hz.
Caractéristiques du son
Le son a un aspect concret, défini traditionnellement par les 4 paramètres suivants, auxquels nous en ajouterons un cinquième, rarement mentionné et pourtant fondamental : la densité.
a) La durée
Elle correspond à l’étalement du son dans le temps : son long, son bref…
b) La hauteur
Elle correspond à la fréquence du « fondamental » (son le plus bas entendu. Dans les accords, la fondamentale).
Elle fait intervenir la notion d’aigu et de grave.

Amplitude d’un son
c) L’intensité
Elle concerne les nuances, la dynamique : puissance, faiblesse du son, donc fort ou doux.
d) Le timbre
C’est la qualité des sons qui nous permet d’identifier les instruments ou les voix dans la partie supérieure du « fondamental ». C’est la couleur d’un son, propre à chaque instrument, voire à chaque instrumentiste.

différents timbres a. corde pincée de la guitare b. corde frottée du violon c. instrument à vent : trompette
e) La densité :
C’est l’impression que donne le son d’être « gros » ou fluet : par exemple un C3 joué avec un son de basse sur un mini-moog et le même C3 joué sur une flûte, même en passant par des tranches de console qui équilibreraient les niveaux, sortira plus « maigre » sur la flûte. C’est de la combinaison des éléments précités que naît la musique : de paramètres mesurables, mêlés au caractère psychoacoustique (lié à la perception acoustique).
Tous ces paramètres sont donc forcément imbriqués et, en ce qui concerne le synthétiseur analogique, il les reconstitue au moyen de plusieurs modules :
Le clavier
Il contrôle la hauteur de l’oscillateur par voltage (tension de commande). Exemple C4 = 1 volt, C5 = 2 volts. 2) Le VCO (voltage controlled oscillator = oscillateur contrôlé par tension).
Son but est de générer une forme d’onde riche en harmoniques, afin de permettre un traitement efficace par la section de filtrage. Le son est donc créé par un oscillateur électrique contrôlé en tension, portant le nom de VCO.
Le type de forme d’onde sélectionné dans l’oscillateur et les réglages du filtre sont déterminants pour le timbre.
Le VCO (Oscillateur contrôlé en tension)
Il génère les formes d’ondes suivantes :
La sinusoïde est la forme la plus pure qui existe. Ce type de forme d’onde est produit par exemple par la flûte.
Le carré produit un son artificiel, très riche en harmoniques. C’est le son électronique par excellence. Il sonne moins « plein » et plus métallique que la dent de scie. On l’utilise par exemple pour les sons d’orgue.
Le triangle est un soupçon agressif. Cette forme d’onde est utilisée pour les effets synthétiques ou par exemple aussi pour les sons purs de type flûté (whistle).
La dent de scie donne un son plus agressif que le triangle. C’est le type de son que produit par exemple un violon ou les brass.
Un VCO ne délivrant qu’une seule fréquence (fondamentale) à la fois, il ne pourra en conséquence produire qu’une seule note.
Un synthé muni d’un seul VCO sera monophonique ; on le réservera alors aux sons de basse et aux sons « lead ».
Si le synthé possède deux VCO, il sera duophonique, à condition que le clavier puisse gérer simultanément deux tensions différentes et indépendantes l’une de l’autre.
Mais si le clavier ne fournit qu’une seule et unique tension de commande, que se passe-t-il ? Alors, il sera monodique, mais le 2e VCO pourra avantageusement se combiner au 1er afin de générer des timbres plus riches.
Le VCF (voltage controlled filter)
C’est un filtre animé lui aussi par une tension de commande (la liaison VCO/VCF est une liaison audio). Ce filtre modifie et trie les harmoniques contenues dans le spectre du son et donc en détermine le timbre.
Le VCF peut aussi être contrôlé par une tension de commande (semblable à celle du clavier). Un point important à retenir : le filtre modifie le timbre en supprimant des harmoniques au signal (provenant du VCO), mais il ne peut pas en rajouter. C’est ce que nous nommons la synthèse soustractive.
Le générateur d’enveloppe (envelop generator) ou EG
Il détermine, si l’on peut dire, la vie ou la mort du son. Il est constitué d’une attaque, d’une durée de décroissance, d’un niveau de soutien et d’un relâchement : A.D.S.R.
Attack : attaque, montée du son.
Decay : affaiblissement, temps de retombée.
Sustain : maintien ou soutien.
Release : relâchement ou deuxième retombée, extinction progressive du son.
Le générateur d’enveloppe (E.G.) sert à programmer les variations de volume dans le temps. Le système ADSR peut permettre, certes, d’imiter la variation du volume d’un son réel, mais il ne suffit certainement pas à le reproduire fidèlement. Par exemple, le choc du marteau sur la corde de piano fabrique un signal complexe, irrégulier et très riche en harmoniques, qu’une synthèse aussi fruste – car limitative et simplifiée – ne peut reproduire.
Le système ADSR a été surtout utilisé dans les premiers synthés. Aujourd’hui, les fabricants proposent plutôt des courbes d’enveloppe que le musicien va affiner, en ajoutant autant de points qu’il le désire.
Le E.G. est animé par un signal logique « oui » ou « non » (touches enfoncées ou au repos), au moyen d’un module appelé « trigger » (déclencheur).
Le VCA (voltage controlled amplifier)
C’est un amplificateur commandé par tension ; le « gain » de son dépendra de l’amplitude de l’enveloppe : le but de ce module est donc d’amplifier le signal délivré par le module générateur.
Le contrôle en tension permet de varier l’amplitude dans le temps. Pour cela, on divisera l’évolution temporelle du volume en plusieurs segments, ceux-là même qui forment l’enveloppe ADSR.
Le LFO Le Low Frequency Oscillator (oscillateur basse fréquence)
est un oscillateur qui agit dans une gamme de fréquences basses inaudibles.
Par analogie, on peut l’assimiler au vibrato des instruments acoustiques. Il influe directement sur le générateur de son. Des réglages permettent d’en moduler l’effet et l’intensité et donc, de faire varier le volume d’un signal d’une façon cyclique.
Pour simuler l’effet de vibrato, le LFO devra moduler à une certaine vitesse la fréquence du signal délivré par le VCO.
En revanche, un trémolo s’obtient en modulant par le LFO le volume du VCA :
Note : La confusion règne souvent lorsqu’il s’agit de définir le trémolo et le vibrato, donc, éclaircissons ce point : – Le trémolo correspond à une variation du volume du signal.
Par exemple, pour appliquer du trémolo dans la voix, il faut faire varier la quantité d’air expirée par les poumons pendant que le son est produit. Il n’y a pas altération de la hauteur de la note produite.
– Le vibrato correspond à une variation de la fréquence du signal. Par définition, lorsqu’on vibre sur une note, on joue faux puisqu’on passe et on repasse de la note de base au demi-ton supérieur (par exemple). À la voix, cet effet est plus difficile à produire que celui du trémolo. Les mauvais chanteurs en mettent partout (mauvaise gestion de la respiration), les bons s’appliquent au contraire à ne l’appliquer que sur la fin des voyelles.
Sur certains synthétiseurs, le LFO peut également agir sur des modules autres que l’oscillateur (par exemple sur la section de filtrage d’un synthétiseur à synthèse soustractive).
Un synthétiseur monophonique dispose au moins d’un LFO, qui agit simultanément sur un ou plusieurs modules.
S’il y a deux LFO, ils agiront de façon indépendante (LFO1 sur le filtre, LFO2 sur VCA par exemple).
Les modules interagissent donc entre eux pour modifier le son initial sortant du générateur de son.
Le musicien peut aussi contrôler les différents paramètres de ces modules à l’aide de contrôleurs : les notes du clavier par exemple, qui agissent sur la hauteur du générateur (VCO ou autre), mais aussi la molette de modulation assignable à différentes fonctions, la molette de pitch bend, agissant en général sur la hauteur du signal, diverses pédales, curseurs ou joystick, etc.
Les presets
Ils correspondent aux sons préréglés mis en mémoire.
En effet, les musiciens ne sont pas tous des programmeurs acharnés. Aussi, les constructeurs ont pensé à eux. Les synthés, aussi bien pour leur fonctionnement interne que pour notre confort, ont besoin de conserver un stock d’informations. En l’occurrence et en ce qui nous concerne, cela peut être des réglages qui correspondent à des sonorités enregistrées dans des mémoires.
Les presets en question sont des timbres programmés en usine et, selon les modèles de synthés, ils peuvent ou non être classés par banques.
Un ensemble de patches (sons) compose une banque : par exemple, une banque de cuivres comprendra 16 sons divers de trompettes avec ou sans sourdine, de trombones, de tuba, etc.
Les banques seront elles-mêmes classées en banque de cuivres, banque de claviers, banque d’effets sonores, etc.

Banque de sons « à l’ancienne » sur disquette
Les timbres préréglés permettent de créer une maquette de votre morceau assez rapidement, mais ont le désavantage de sonner « sons d’usine ». Leur utilisation systématique est donc banale. L’intérêt du synthé, contrairement à un instrument classique, n’est pas dans la recherche de la virtuosité ou de l’égalité du son ; mais – et il rejoint ici l’instrument traditionnel – dans la recherche d’un son original et personnel : on aura donc tout intérêt à essayer d’obtenir des timbres originaux grâce à la programmation des sons.
Dans un premier temps, il est plus facile de « partir » d’un son d’usine et de le « bidouiller », pour en venir ensuite à programmer à partir de la forme d’onde initiale (plus difficile mais tellement plus gratifiant).
Pour ne pas perdre le travail effectué, les sons seront stockés dans une mémoire.
Les différents types de mémoire
Les mémoires vives ou RAM (Random Access Memory)
Ce sont des mémoires à lecture-écriture.
Elles sont gérées par des circuits intégrés capables d’enregistrer les informations mais aussi de les restituer.
Elles peuvent être effacées à tout moment par l’utilisateur ou – malheureusement – par une panne de courant intempestive si elles ne sont pas maintenues sous tension constante par une pile.
Les mémoires mortes ou ROM (Read Only Memory)
Ce sont des mémoires à lecture seulement. Leur contenu est donc enregistré une fois pour toutes en usine ; il ne peut être modifié.

Ma vieille SP12 avec ses 24 échantillons en ROM (!)
Mais il est toutefois possible d’en modifier les paramètres et d’obtenir un nouveau timbre, qui pourra être sauvegardé dans une mémoire d’utilisateur (user).
Les Presets sont stockés dans ce type de mémoire, de nature non volatile (Vous pouvez donc vous amuser à faire disjoncter votre installation électrique).
Autres types de mémoire
Nous ne nous attarderons pas sur ces types. Il faut seulement savoir que pendant quelques années, il était possible, sur certains synthés, de brûler, donc d’effacer certains types de ROM appelés EPROM et de réécrire dessus des informations (vous pouvez encore faire disjoncter) ; certains autres synthés étaient munis d’un lecteur de disquettes, ce qui avait l’avantage de pouvoir charger des banques à volonté (certains musiciens possédaient des centaines de disquettes de sons).
On se servait aussi des bandes magnétiques, dont les informations « FSK » étaient envoyées par le synthé grâce à une interface spécifique.

L’italien Crumar Bit 01. On peut sauvegarder les sons sur bande magnétique (bouton Save) et les renvoyer aussi vers la machine (bouton load). Le bruit de codage généré pendant le transfert est très sympathique.
Les temps de transfert vers la bande magnétique (tape save) et de rechargement vers l’instrument (tape load) se révélaient particulièrement longs. Dès que cela a été possible, on a commencé à transférer et à stocker les données vers les disques durs des ordinateurs, au moyen de l’interface MIDI*.
* Nous n’allons pas développer ici toutes les normes (MIDI…), ni tout l’environnement propre aux synthés (tables de mixage, effets et périphériques divers…), connectique, séquenceurs, audionumérique (Pro tools…)
Les différents synthés
Les synthés analogiques et numériques
Nous venons de décrire schématiquement le fonctionnement d’un synthé. Il en existe deux sortes : les analogiques et les numériques.
Le synthé analogique
Il peut être monodique ou polyphonique.
Analogique : les tensions utilisées sont proportionnelles aux paramètres du son et déterminent une forme électrique qui lui ressemble : d’où « analogie ».
Monodique veut dire : jouer une seule note à la fois.
La technique analogique monodique réunit plusieurs systèmes monodiques, c’est-à-dire :
Polyphonique : le synthé est contrôlé par le clavier, équipé d’un circuit logique complexe. On obtient ainsi des synthés à 2/4/6/8/n voix. On réunit donc dans un même instrument plusieurs ensembles monodiques complets, chaque voix étant au moins constituée d’un ou deux VCO, d’un VCF, d’un EG et d’un VCA.
En sus des modules indispensables – VCO, VCA… – certains synthés analogiques contiennent d’autres modules inexistants sur les synthés numériques (sample and hold, ring modulator, etc.).
Aujourd’hui, la technique analogique s’allie à celle du numérique, par exemple pour gérer les sons ou le clavier. Les synthés utilisent aussi le DCO (digital controlled oscillator) à la place du traditionnel VCO, pour une plus grande stabilité de fréquence.
Les principales caractéristiques sonores des synthés analogiques de type VCO procurent une rondeur des nappes, un son chaud et vivant.
Le synthé numérique
C’est simplement le nom que l’on donne aux synthés analogiques utilisant l’informatique (microprocesseurs), pour le classement des mémoires ou la gestion des claviers. D’où gain de temps et d’espace.
Le synthé de type FM ou à modulation de fréquence
Principe sonore développé en 1970 par John CHOWNING : le son est produit par une chaîne (algorithme) de générateurs – portant le nom d’opérateurs (operators) – se modulant entre eux par des ondes à l’origine de type sinusoïdal.
L’agencement des opérateurs s’appelle donc algorithme. L ‘operator se situe en fin d’algorithme (chaîne). Il s’appelle le porteur (onde porteuse) ou encore le carrier (fréquence porteuse).
Ce système a été exploité par Yamaha, notamment pour son célèbre DX7.
Par exemple, dans le schéma 2, les opérateurs 1 et 4 sont porteurs. Voyons qui module qui :
* Feedback : rétroaction, retour sur soi-même : peut aller jusqu’à générer un bruit blanc (taux d’harmoniques très élevé).
À chaque opérateur correspond un E.G. Si l’opérateur est un « porteur », son EG agit sur la dynamique du son (volume sonore), comme par exemple le EG/VCA du système analogique.
Si l’opérateur est un « modulator », son EG agit sur le spectre harmonique du son (timbre) et ses variations dans le temps, comme le EG/VCF du système analogique.
Schéma de l’opérateur :
Imaginons maintenant un algorithme de deux opérateurs : un modulateur et un porteur 2 — 1 :
« Plus le rapport des fréquences s’écarte d’une fraction simple, plus la forme d’onde résultante est complexe ».
Les avantages de la modulation de fréquence ne sont pas négligeables : grâce aux 6 opérateurs par note, il est possible de créer n’importe quelle forme d’onde et la présence du générateur d’enveloppe, associé à chaque opérateur, permet de faire évoluer le timbre des sons dans le temps.
Le DX7 fait partie de la « légende » des synthés : réelle nouveauté sonore, riche et particulière.
La synthèse harmonique
La synthèse additive
On rajoute à un son basique, composé d’une fréquence unique, des fréquences multiples de sa fréquence de base (fréquence fondamentale). En conséquence, le son initial est enrichi par des signaux appelés harmoniques.
Plusieurs procédés existent, mais en voici un courant : plusieurs générateurs produisant des sons sinusoïdaux expriment, en les additionnant (ou superposant), la configuration souhaitée d’un spectre sonore, en faisant varier la hauteur (fréquence) et l’enveloppe (EG) de chaque opérateur.
– La fréquence la plus basse représentera la fondamentale (fondamental).
– Les fréquences les plus hautes représenteront les harmoniques.
Remarque : le DX7 possède ce type de synthèse avec l’algorithme 32.
Chaque opérateur produit un son pur (à part le 6 si on le souhaite). L’addition de ces six sinusoïdes donnera naissance à un son complexe comportant un fondamental (choisi) et cinq harmoniques (choisies).
Le DX7 délivre cinq harmoniques sur l’algo 32, cependant, des grosses machines comme le Fairlight de CMI peuvent aller jusqu’à 31 harmoniques ; mais c’est d’une technologie bien plus coûteuse. Elle est dessinable (EG) par crayon optique.
Un autre procédé de la synthèse additive consiste à mélanger des formes d’ondes complexes (et non plus simplement sinusoïdales), afin de rendre les timbres plus riches.
La synthèse soustractive
Un ou plusieurs générateurs produisent des sons très riches en harmoniques et l’on filtre par élimination, plus ou moins, ces derniers. D’une part, ce sont les principes de tous les synthés analogiques et de l’autre, la qualité du son dépendra de la qualité des filtres.
Cette forme de synthèse peut s’appliquer à divers types de générateurs, tels que VCO, DCO, échantillons, etc.
La synthèse de forme d’onde
a) Le « waveform drawing »
On dessine à l’aide d’un crayon optique chaque paramètre des ondes formant le son, directement sur un écran. Si l’onde est complexe, on en divise le dessin sur plusieurs pages. On peut soit créer l’onde ou alors en choisir une sous-forme de presets mis à disposition dans la machine.
b) Le VS (Vector synthesis : synthèse vectorielle)
Ce procédé emploie un algorithme capable de créer des sons complexes et de les travailler en temps réel.
c) Le DWGS (Digital waveform generator system)
On n’utilise plus les traditionnelles formes d’ondes : sinusoïdes, carrés, triangles, dents de scie que produisent les VCO ou DCO, mais des sons créés au préalable par synthèse additive (donc très réalistes : piano, violon, trompette, etc.) et stockés dans des « mémoires mortes » pour être ensuite traités analogiquement par des VCF, VCA, EG, etc. d)
d) La technique PCM (Pulse code modulation).
C’est une technique numérique d’échantillonnage classique : – Les sons réels d’instruments sont analysés, codés en binaire (0 et 1) et stockés dans des mémoires mortes : ROM (read only memory). Cette technique a longtemps été utilisée pour les claviers « grand public », en raison de la fidélité relative des timbres par rapport aux sons de type VCO/DCO.
e) La distorsion de phase.
En faisant varier la vitesse de lecture des mémoires mortes stockant des ondes sinusoïdales – c’est-à-dire en accélérant ou en ralentissant de façon complémentaire (angle de phase*) – on obtient des formes d’ondes plus ou moins complexes.
La qualité des sons obtenus est proche de celle des synthés analogiques, mais avec la précision des techniques numériques.
* « Angle de phase » : en faisant varier la vitesse, on déforme la sinusoïde et à chaque déformation, il y a création de fréquences harmoniques.
Conclusion
Les synthés, de par les progrès en électronique, sont de plus en plus performants et il est maintenant rare qu’ils n’aient pas à leur disposition des effets intégrés. Pour peu qu’ils possèdent également un séquenceur et même un échantillonneur, ils deviennent alors de véritables petits studios d’enregistrement qu’on appelle workstations.
Soyez le premier à commenter !