1 The Loudness War Mémoire de fin d’année SAE Institute Christophe de Volder AEDS311
1
The Loudness War
Mémoire de fin d’année SAE Institute Christophe de Volder
AEDS311
2
Sommaire
1. Abstract p. 3
2. Introduction p. 3
3. L’amplitude dynamique p. 4
4. La « Loudness » p. 5-‐6
5. La psychoacoustique p. 6-‐7 a) Vue d’ensemble b) Loudness War contre Psychoacoustique c) Expérience de lecture
6. Les mesures de niveau de la Loudness p. 8-‐10
a) Types d’unité de mesure de niveau pertinentes b) Types de système de metering
7. Le mastering p. 10-‐13
a) Définition b) Brève histoire du mastering c) Le mastering aujourd’hui d) Quelques exemples d’équipement de mastering
8. Le remastering p. 13-‐14
a) Définition
9. Origine de la Loudness War p. 14-‐16 a) Le début b) Le vinyle c) Les supports digitaux, une révolution
10. Les conséquences de la « Loudness War » p. 17-‐20
a) Les formes d’ondes b) Prise de conscience collective c) L’aspect émotif
3
11. Les acteurs de la « Loudness War » p. 20-‐24 a) Les artistes b) Les maisons de disques c) Itunes/ Beatport/ Spotify/ les Web Labels d) En radio e) En télé f) En cinéma g) Usage non musical de la musique (ambiancement sonore)
12. Etude de cas (Muse-‐ Madness) p. 24-‐31
13. Mouvements collectifs p. 31-‐32
14. Controverse – Emmanuel Deruty p. 32-‐35
a) Emmanuel Deruty b) Article Sound on sound c) Syndrome du «C’était mieux avant»
15. Impact sur les nouveaux styles musicaux p. 35-‐36
a) Les artistes b) Les techniques
16. Nouvelles normes techniques (Norme ebu rs128 et
iTunes Soundcheck) p. 36-‐37
17. Sonnox (Fraunhofer Pro-‐Codec) p. 38 a) Présentation b) Fraunhofer Institute
18. L’évolution probable p. 39
19. Conclusion p. 40
20. Webographie et Bibliographie p. 41
21. Remerciements p. 42
4
1. Abstract
La Loudness War ou « Guerre du niveau », est un phénomène historique de l’industrie musicale dans son sens le plus large, qui démarre dans les années soixante. De façon générale, c’est une pratique qui vise à réduire l’amplitude dynamique sur des supports audio destinés à la diffusion, afin d’augmenter la perception du niveau sonore par l’auditeur. Ce mémoire a pour objectif de comprendre ce phénomène, en se basant sur les différents éléments qui nous semblent être les plus pertinents.
2. Introduction
Nous focaliserons notre travail sur un seul aspect du comportement du son : la nuance, appelée aussi dynamique. Construire une démarche de compréhension globale de la Loudness War pose une difficulté. En effet, comment structurer de façon cohérente un phénomène impliquant autant d’éléments différents les uns des autres ? Qu’ils soient historiques, physiologiques, technologiques, culturels ou encore émotifs… Premièrement, nous devons comprendre ce qu’est la dynamique, et l’influence que son altération ou sa modification possède sur la perception. Nous nous intéresserons ensuite à la façon dont nous la percevons au niveau physiologique et émotif. Nous définirons plus loin les moyens techniques disponibles pour mesurer la dynamique, ainsi que les outils permettant d’influer sur celle-‐ci. Enfin, nous nous attacherons à décrire l’impact que ce phénomène possède au niveau historique et culturel. Pour synthétiser cette démarche nous évaluerons son évolution probable, avant d’y apporter une conclusion.
5
3. L’amplitude dynamique Selon Wikipédia : « D’une façon générale, la dynamique d’une grandeur est le niveau relatif de ses valeurs minimale et maximale. Elle représente le domaine de variation de la grandeur. La dynamique est une grandeur sans dimension qui s’exprime généralement en décibels. Dans le domaine de l’acoustique et de l’électroacoustique, la grandeur pertinente est la sonie, c’est à dire le niveau sonore ressenti par les êtres humains ». Pour simplifier, l’amplitude dynamique se voit sur la forme d’onde : c’est l’écart qui sépare le point le plus bas du point le plus haut sur celle-‐ci. Il est à noter que la dynamique d’une grandeur n’est jamais nulle. En effet, sur n’importe quel type de support, il existera toujours un bruit de fond. La différence intentionnelle de sonie entre des actions musicales s'appelle la nuance. Elle s'exprime, dans la musique écrite, par des indications qui vont de pianissimo à fortissimo et les signes crescendo et decrescendo. La dynamique d'un instrument est la différence entre la sonie la plus forte et la plus faible qu'un musicien puisse produire avec lui. L'élévation de la pression acoustique s'accompagne d'une variation de la composition spectrale. Cette variation de sonorité participe à l'impression de puissance sonore. Toutes ces caractéristiques font partie du timbre qui permet d'identifier l'instrument. Tous les instruments n'ont pas la même capacité à produire des nuances. Exemple : Dynamique d'un orchestre symphonique : On mesure le niveau de bruit de fond d'une bonne salle d'écoute de musique classique, public présent, alors que le chef a réclamé le silence, à 38 dB. Le niveau maximal de la musique, entendu au milieu du parterre dans le passage le plus fort, est à 122 dB. La dynamique de cette exécution musicale est de 122 -‐ 38 = 84 dB Le niveau est mesuré sur une période de temps donné, courte (micro dynamique), ou longue (macro dynamique). Dans le champs d’application de ce mémoire, nous nous intéresserons principalement au concept de micro dynamique.
6
4. La « Loudness »
La loudness signifie la quantification de la perception du son chez l’être humain. C’est une méthode de mesure psychosensorielle, qui se rattache de façon complexe à la psychoacoustique, et à la pression sonore. Elle se base sur des statistiques, car la perception du bruit et du son en général varie d’un individu à l’autre. Le terme français est la « sonie ». Elle se mesure en phones et en sones. -‐ Le phone
C’est une unité de perception de niveau acoustique d’un son pur. 1 phone = 1 db SPL à la fréquence de 1 Khz L’unité de mesure de pression est le Pascal. Il signifie la force en Newton qui est exercé sur une surface plane en m2. 20 μPa = 1 dB SPL
-‐ Le sone Un Sone équivaut à une fréquence de 1 Khz émise à 40 dB, et qui correspond à 20 μPa. 2 sones signifient que cette fréquence est perçue deux fois plus fort par l’oreille humaine. En phone, ce doublement d’intensité se traduit par une augmentation de 10 db. Corrélation entre Sones et Phones :
sone 1 2 4 8 16 32 64 phone 40 50 60 70 80 90 100
L’oreille possède une courbe de perception des fréquences qui varie en fonction de l’intensité sonore. On les appelle « courbes isosoniques ». Celles-‐ci furent mesurées pour la première fois en 1933 par Fletcher et Munson dans les laboratoires « Bell Labs ». En 1956, Robinson et Dadson effectuèrent des nouvelles mesures, plus précises. Celles-‐ci furent la base du standard ISO226 qui fut considéré comme définitif jusqu'en 2003.
7
En raison de divergences entre les mesures anciennes et les récentes, l'Organisation internationale de normalisation (ISO) a actualisé en 2003 la norme ISO226, en se basant sur plusieurs études de chercheurs japonais, allemands, danois, britanniques et nord-‐américains.
Les courbes de Fletcher et Munson :
Ce graphique représente les courbes isosoniques de pression acoustique (en dB SPL), en fonction des fréquences ayant le même niveau en phones, c’est à dire provoquant la même sensation d’intensité sonore pour l’oreille humaine.
5. La psychoacoustique
a) Vue d’ensemble :
La psycho acoustique est l’étude des sensations auditives de l’homme. Elle étudie comment la propriété des ondes est captée par le système auditif, et la manière dont elles sont interprétées par le cerveau. Chacun perçoit et ressent les sons de façon différente. L’oreille humaine fonctionne comme un microphone. Le tympan est une membrane comme une capsule de micro. Le cortex fait office de convertisseur. Il transforme une oscillation de l’air en une impulsion électrique comprise par le cerveau. Autant on connaît l’anatomie de l’oreille, autant son fonctionnement au niveau neuronal nous échappe.
8
C’est à cette étape de compréhension du son, que l’on entre dans un domaine subjectif. En effet, certaines personnes détestent la musique classique, tandis que d’autres ne supportent pas le death metal. Nous savons maintenant que la perception du son change en fonction de son intensité. Plus le son est fort, plus le canal auditif se referme. C’est un réflexe de protection qui agit donc comme un filtre (le canal est plus petit donc moins de fréquences parviennent au tympan). Ces différents paramètres rendent difficile l’analyse objective des effets réels de la Loudness sur un sujet donné.
b) Loudness War contre Psychoacoustique :
Lors d’une conférence à l’AES (Audio Engineering Society), Bob Katz, célèbre ingénieur de mastering, nous dit que les différences de perception auditive sont plus importantes quand on augmente le niveau que quand on le diminue. Il nous dit aussi que la Loudness agit comme une drogue. Plus le niveau est fort, plus le cerveau génère d’hormones : phéromones et endorphines. Ce sont des hormones de plaisir.
Bob Katz, dans sa méthode de travail, possède quatre « armes » pour augmenter la sensation de loudness. Celles-‐ci sont : -‐ le boost agressif dans les hautes fréquences, -‐ le « Peak normalisation », -‐ le « Peak limiting » -‐ le « Digital clipping » Globalement ces quatre méthodes génèrent des harmoniques dans les hautes fréquences, qui augmentent la sensation de Loudness.
c) Expérience de lecture :
IT'S THE MEDIA INDUSTRY'S WAY OF GETTING ATTENTION AND SOUNDING "EXTREME." APPARENTLY, THAT'S THE WAY AMERICANS LIKE TO CONSUME THINGS THESE DAYS: LOUD, OBNOXIOUS AND UTTERLY DEVOID OF SUBTLETY OR NUANCE. IT'S THE AUDIO EQUIVALENT OF WRITING IN ALL CAPITAL LETTERS. IF YOU'RE GETTING EDGY READING THIS, IT'S BECAUSE PSYCHIATRISTS HAVE SHOWN THAT READING IN ALL-‐CAPS IS MENTALLY EXHAUSTING. WE NEED VARIATION AND FLUCTUATION.
9
6. Les mesures de niveau de la Loudness
Afin de mieux comprendre les effets de variations de niveau sonore, et de calcul d’amplitude dynamique, il est important d’avoir une compréhension de la façon dont ceux-‐ci se mesurent et se visualisent.
a) Types d’unités de mesure de niveau pertinentes -‐ dBSPL : (Sound Pressure Level) Cette unité de mesure sert à mesurer les bruits environnementaux. Dans la pratique « dB » est généralement utilisé pour « dB SPL » -‐ Les niveaux SPL exprimés simplement en db ne sont généralement pas pondérés. Toutes les fréquences sont traitées de manière identique. Au contraire, les SPLs, exprimés en « db A » sont pondérés suivant une courbe de type A, se rapportant à la courbe isosonique à 40dB, et sont donc plus proches de l’intensité sonore réellement perçue.
-‐ dBLUFS : (Loudness Unit referenced to Full Scale) LUFS désigne l'unité de mesure pleine échelle de l'intensité sonore d'une séquence audio dans un court et long terme, selon une courbe de pondération isosonique K, aussi appelée R2LB. Celle-‐ci accentue les aigus de 4dB au dessus de 3kHz pour tenir compte de l’influence acoustique de la tête humaine en stéréophonie. L'échelle LUFS est graduée par pas de 1 LU, équivalent à un pas de 1 dB. C’est une nouvelle méthode de mesure adaptée à la norme EBU R128. Norme qui a été mise en vigueur le premier Janvier 2012 et qui consiste à estimer le niveau sonore subjectif, afin d’adapter le niveau électrique avant émission. Elle est désormais obligatoire en Broadcast. Trois paramètres sont pris en compte : -‐ la mesure instantanée (momentary loudness) : fenêtre glissante de 400 ms. -‐ la mesure short term : fenêtre glissante de 3 sec. -‐ la mesure infinie (integrated loudness) : sur toute la durée du programme En combinant ces valeurs, on obtient une valeur corrélée et pondérée, qui définit le niveau général du signal. La valeur de la mesure de la loudness du programme est normalisée à -‐23LUFS.
b) Types de systèmes de metering
-‐ VU mètre Le « Volume Unit Meter » sert à indiquer que le signal approche de la valeur nominale, (0 db) afin de permettre aux opérateurs d’en régler le niveau.
10
C’est un appareil électromagnétique passif mais il peut être représenté de différentes manières (à aiguille ou à rampe de LED). Le temps de réponse d’un VU mètre est de 300 millisecondes, et l’échelle va de -‐20dB à +3dB. La normalisation du VU mètre est apparue en 1939, de la nécessité de nombreux opérateurs de télécommunication et de radiodiffusion (principalement les Laboratoires Bell et des chaînes américaines de radio CBS et NBC) de coordonner leur action. -‐PPM : Le « Peak Programme Meter » est un modulo mètre qui indique les niveaux de crête d’un signal audio beaucoup plus rapidement que le VU mètre (=> 5ms). Le PPM est initialement développé par les diffuseurs radio allemands vers la fin des années trente. Il existe plusieurs normes de PPM. Leurs caractéristiques connaissent de nombreuses évolutions au fil des ans, qui diffèrent surtout par l'affichage et les niveaux de référence.
• Échelle DIN (Deutsches Institut für Normung) L'échelle va de -‐50 à +5 dBu. Elle marque le début de la « zone rouge » avec l'inscription « O dB » à +6 dBu. Le repère de « test » est à -‐9 dB.
• Échelle NORDIC. Elle est graduée en dBu et non par rapport au niveau nominal. L'échelle court de -‐36 à +9 dBu (quelquefois -‐42 à +12 dBu). Le début de la « zone rouge » se trouve à +6 dBu. Le repère de « test » est à 0 dBu.
• Échelle BBC. Elle comporte une échelle de 0 à 7. Le 4, situé au milieu de l'échelle, correspond à 0 dBu. Il y a 4 dB, avec un signal de test sinusoïdal, entre les repères de 1 à 7.
-‐dBLUFS Meter C’est l’instrument de mesure servant à calculer le niveau d’un signal selon la norme EBU R128. Les marques proposant ce type d’instrument sont Dolby, Waves, et TC Electronics.
-‐K-‐Meter C’est un système proposé par Bob Katz, qui sert à calibrer un système de monitoring, afin que les ingénieurs du son obtiennent une dynamique raisonnable dans leurs productions. Ce système de mesure est défini par différentes caractéristiques :
-‐ Le 0 doit être calibré à un niveau sonore de 85 dBSPL -‐ Il doit y avoir un gradient de 24dB de manière linéaire en dessous de 0 -‐ Une indication tricolore est suggérée : Vert (-‐24 à 0), Orange (0 à 4) et rouge (au
dessus de 4) -‐ Trois indicateurs de niveau sont nécessaires :
§ Un qui indique le niveau Peak (1 sample) des 10 dernières secondes et qui redescend de 24dB toutes les 2secondes
§ Un autre qui reste à un niveau crête (choisi par l’utilisateur) si celui ci est atteint
§ Un dernier qui indique le niveau moyen des 10 dernières secondes.
11
Il existe trois systèmes de metering qui diffèrent uniquement par leur graduation et leur amplitude dynamique.
-‐ Le K-‐20 (papa meter) est utilisé pour les mixes qui nécessitent une très large amplitude dynamique, comme la musique classique (symphonie) et la musique audiophile.
-‐ Le K-‐14 (mama meter) est le système utilisé pour la majorité des productions musicales, allant de la pop moderne au hard rock.
-‐ K-‐12 (baby meter) est lui destiné aux productions dédiées au broadcast.
7. Le mastering a) Définition
C’est l’étape qui vise à préparer un enregistrement sonore en vue de sa duplication sur n’importe quel type de support. Le mastering désigne donc l’étape finale de préparation du son. Néanmoins c’est une dénomination erronée. En effet, le mastering désigne en réalité l’étape de fabrication de la matrice physique servant à la duplication des supports. Par exemple, dans le cadre du disque vinyle celle-‐ci s’appelle le « Stamper ». Dans le cadre du CD, on l’appelle « Glass-‐master ». Ce que l’on appelle donc généralement le « mastering » se nomme en fait le « pré-‐mastering ». Afin de faciliter la compréhension de ce mémoire, nous utiliserons le terme communément usité de « mastering ».
12
b) Brève histoire du mastering Au départ, les enregistrements sonores se faisaient directement sur disques vinyles, en temps réel, sans possibilité de montage. A la fin des années quarante apparaît le magnétophone à bande magnétique ainsi que les premiers ingénieurs de mastering, qui sont chargés de transférer les enregistrements sur bandes vers le vinyle. Ce support final possède néanmoins beaucoup de contraintes techniques, qui se compliquent encore avec l’apparition de la gravure stéréo en 1957, notamment au niveau de la corrélation de phase. A l’arrivée du CD dans les années nonante les contraintes du support vinyle disparaissent : Plus de problèmes de corrélation de phases et beaucoup plus de headroom. D’autre part, les différents outils de traitement deviennent aussi plus précis. Un exemple notable est l’égaliseur paramétrique inventé par George Massenburg en 1971, qui révolutionne le concept d’égalisation et permet de pousser beaucoup plus loin les possibilité de modification du timbre. Le mastering est donc au départ, une étape simplement technique, qui consiste à réaliser une copie « zéro » qui servira à la duplication. En plus d’une préparation, c’est une étape de vérification.
c) Le mastering aujourd’hui L’évolution technologique des systèmes de traitement sonore a ensuite permis d’aborder ce processus de façon plus créative. En effet, en plus d’harmoniser les niveaux des morceaux entre eux sur un album, les EQ et les différents systèmes de compression ont permis d’en harmoniser leurs « couleurs sonores » respectives. De discipline simplement technique, le mastering est devenu une étape créative et sensible. Les assistants auxquels on confiait la préparation des bandes masters restaient anonymes dans les années 50. Aujourd’hui des ingénieurs de renom tels que Bob Ludwig, reçoivent des prix prestigieux comme des Grammy Awards, qui récompensent l’impulsion créative permettent aux projets sur lesquels ils travaillent de se « sublimer » au niveau sonore.
d) Quelques exemples d’équipement de mastering On utilise principalement des compresseurs, des équaliseurs et des limiteurs. Ceux-‐ci sont soit analogiques, soit digitaux. -‐ Les équaliseurs analogiques servent principalement à travailler la couleur du
timbre, ou à corriger les parties problématiques du spectre d’un signal.
13
Pultec eq P1
Sontec
Il est intéressant de savoir que le Sontec a été mis au point par Georges Massenburg, inventeur du concept de l’égaliseur paramétrique. Manley massive passive -‐ Les compresseurs analogiques servent au travail d’enveloppe.
Tube tech LCA2B,
UREI 1176
Fairchild 670
Le hardware digital possède souvent une fonction correctrice (chirurgicale).
Weiss eq1 MK2
14
Un exemple de limiteur digital très utilisé en mastering : TC Electronics M6000
8. Le remastering
a) Définition Le remastering désigne le processus de fabrication d'un nouveau master pour un album, un film, ou toute autre œuvre de création audiovisuelle. Le remastering peut aussi désigner une étape du processus de conservation et de restauration des films. Certains enregistrements récemment remasterisés ont été critiqués pour leur traitement excessif comparé aux enregistrements originaux. Un exemple notable est l’évolution du morceau « Black and White » de Michael Jackson :
1991 : Original « Dangerous » Album 1995 : « HiStory » (Begin) CD1 2007 : « The Ultimate Collection » CD3
Ces trois images nous montrent l’impressionnante réduction de l’amplitude dynamique lors des deux remastering.
15
9. Origine de la Loudness War a) Le début
Phil Spector est généralement considéré comme l’instigateur de la guerre du niveau. On appelle sa technique de production le « mur du son » (Wall of sound). C’est un son dense, riche, plein et puissant. A son apogée, personne n’atteignait son niveau de densité sonore, qui est un élément important ayant provoqué son succès fulgurant. Phil Spector superposait de nombreuses pistes de guitares amplement réverbérées. Il n’hésitait pas à enregistrer deux bassistes jouant à la quinte, dans des « chambres d’écho » naturelles. Son inventivité a permis de grandes avancées au niveau de la production musicale. Il est une influence majeure de la génération de producteurs issus des années septante. Phil Spector a posé de nouveau jalons et a placé de nouveaux référents qui ont révolutionné les techniques utilisées dans les studios d’enregistrement. A l’époque, la diffusion radio s’effectuait sur de petites enceintes de transistors portables. Le but de Spector était d’en tirer parti au maximum.
Cette guerre continue ensuite dans les juke-‐boxes, durant les années soixante, qui à l’époque passent des disques vinyles de format sept pouces (45 tours). Le niveau de ces appareils était réglé par les tenanciers d’établissements. Par conséquent, les studios de gravures de disques vinyles avaient tendance à augmenter le niveau de sortie de leurs gravures, pour se démarquer des autres productions. Un exemple connu est celui du label Motown Records, grand adepte de cette pratique. Ils désiraient augmenter le niveau tout en gardant une clarté sonore. Les ingénieurs gravaient leurs productions en mono et poussaient les fréquences autour de 8-‐10kHz. Ils filtraient ensuite à l’aide d’un « brick wall high-‐pass filter » tout ce qui se trouvait en dessous de 70Hz.
b) Le disque vinyle
-‐ Le Half speed mastering C’est une technique de gravure de vinyles qui consiste à diviser par deux la vitesse du playback de la source sonore (Tape), ainsi que la vitesse de gravure (33.3 rpm ou 45rpm divisée par deux). La raison principale vient du fait que lorsqu’on pousse le niveau de gravure, les distorsions se font premièrement ressentir dans les hautes fréquences (sibilance). En divisant le vitesse par deux, on divise aussi le spectre du signal : 10kHz devient 5kHz. On peut donc pousser beaucoup plus fort le signal avant d’avoir de la distorsion dans les aigus. Lorsqu’on rejoue la gravure à vitesse normale, on récupère la vitesse d’origine (5kHz redevient 10kHz). Néanmoins, il existe un problème de taille au niveau des basses fréquences. En effet, le 50Hz devient du 25Hz, ce qui provoque une modulation beaucoup plus ample du signal, ce qui génère une plus grande amplitude d’oscillation du sillon. Comme le sillon prend plus de place sur la face du vinyle, la durée que l’on
16
peut graver sur le support s’amoindrit. Néanmoins, comme l’intensité de la distorsion au niveau des aigus est fortement diminué, cette technique permettait d’atteindre un niveau de sortie beaucoup plus élevée. A une époque elle fut une arme essentielle dans l’évolution de la Loudness War. Cette technique était surtout utilisée pour graver de la musique classique (cf. Deutsche Gramofone), c’est à dire un genre musical où l’exigence technique est très élevée. Aujourd’hui cette technique n’est pratiquement plus utilisée, principalement pour des raisons de temps, et donc de coûts. En effet, graver une demi heure de musique prend une heure.
Vitesse de défilement de la bande -‐ 38 : 38 cm/s (full speed mastering) -‐ 19 : 19 cm/s (half speed mastering)
Ci-‐dessus, un lecteur à bande Telefunken M-‐10A inclus dans une console de gravure vinyle Neumann SP-‐60.
-‐ La relation niveau/ durée Sur un vinyle, au plus le signal gravé est fort, au plus l’amplitude de l’oscillation du sillon est large. D’autre part, au plus le signal comprend des basses fréquences, au plus, là aussi, l’amplitude du signal est large. Donc, au plus on grave fort, au moins on a de temps disponible sur le support. Un moyen pour réduire l’amplitude de l’oscillation d’un sillon est de réduire l’amplitude dynamique du signal à l’aide d’un compresseur.
17
Peu de modulation (compression) Grande modulation (peu de compression)
-‐ La loudness war dans le vinyle Historiquement, on place les peaks du vinyle à zéro dB. Cependant, il existe encore une marge de manœuvre. Par exemple, dans les années 80, la société Deutsche Grammofon (qui doit être considéré comme un référent ultime au niveau de l’exigence et de la perception technique de l’époque), place les peaks à +4 dB. Néanmoins, il est à noter que dans le domaine de la musique électronique à partir de 1988 (House music puis la techno, la drum&bass et la Jungle), +4 dB est le seuil minimum acceptable pour les peaks. Il existe certains disques (CF. Maurizio, Richie Hawtin, Optical, etc) atteignant parfois jusqu’à +12 dB. A ce niveau de sortie, d’importantes distorsions se produisent au niveau des hi-‐hats et des snares mais elles font partie intégrante du processus de production musicale. La distorsion et la sibilance sont des « matières sonores » très recherchées chez les producteurs. Cette méthode de mastering qui vise à repousser constamment les limites du support, est une composante essentielle de leur démarche créative. Les studios les plus connus dans ce domaine sont : NSC à Detroit (Ron Murphy), The Exchange à Londres (Simon Davey), et Dubplates & Mastering à Berlin (Moritz Von Oswald, Rashad Becker).
c) Les supports digitaux, une révolution
L’invention du CD dans les années quatre-‐vingt permettra de dépasser les limites du vinyle, grâce à leur plus grande amplitude dynamique disponible. S’ouvre alors, pour les ingénieurs de mastering, un nouveau « champ des possibles ». On entre alors dans la deuxième phase de la Loudness War. C’est à ce moment que le limiteur devient l’outil essentiel des ingénieurs. La où on considère communément que le vinyle atteint sa limite à +4 dB (excepté en musique électronique) le niveau de sortie du CD évoluera environ d’un dB par an pendant vingt ans, pour atteindre donc +20 dB aujourd’hui.
18
10. Les conséquences de la Loudness War
a) Les formes d’ondes Ci-‐dessous, on peut voir une évolution des masters de CD commercialisés depuis 1983 jusqu’à 2000.
-‐ 1983 Bryan Adams-‐ Cut Like a Knife (A&M CD-‐3288)
Comme on peut le voir ci-‐dessous, le plus haut peak sur le CD entier est à – 2,52dB, soit 74,8% de la marge dynamique du CD.
-‐ 1988 Willie Nelson-‐ What a wonderful world (Columbia CK 44331) Sur ce CD, il n’y a qu’un seul peak à 100% de dynamique mais ne « clippe » pas. Tout le reste de l’album est en dessous de cette limite.
-‐ 1987 Georges Michael-‐ Faith (Columbia CK 40867)
19
Revenons un an en arrière et l’on constatera que dans l’album de George Michael, il y a de nombreux peaks a 100%, mais que ca ne « clippe » toujours pas.
-‐ 1995 The Rembrandts-‐ I’ll be there for you (EastWest Atlantic 61752-‐2) Sans commentaire…
-‐ 1999 Ricky Martin-‐ Livin’ la Vida Loca (C2/Columbia CK 69891)
Ou comment repousser les limites de l’impossible…
20
b) Prise de conscience collective En 2008, le groupe Metallica sort l’album « Death magnetic », vendu à près de neuf millions d’exemplaires. En 2009, sort le jeu vidéo « Guitar Hero » dans lequel on retrouve une version du morceau « My Apocalypse » présent sur l’album de Metallica. Les techniques de mastering étant différentes entre un C.D. et un jeu vidéo, ce morceau n’a pas subi le même traitement dynamique. Les fans de Metallica ont donc pour la première fois pu entendre les deux versions. Une importante controverse s’en suit. Un consensus généralisé se crée, la majorité des auditeurs préférant largement la version présente sur le jeu vidéo. De vives critiques sont émises à l’encontre de Rick Rubin, responsable de la production de l’album, que les fans accusent d’avoir gâché. Trop de compression, de distorsion, l’album est même parfois qualifié d’inaudible par les chroniqueurs et les fans. Apparaît alors une pétition en ligne demandant le remastering de l’album, en se basant sur la qualité de la bande son du jeu vidéo. A ce jour, elle recueille déjà plus de 22000 signatures et est accessible ici :
http://www.gopetition.com/petitions/re-mix-or-remaster-death-magnetic.html
Voici un comparatif des waveforms des deux versions :
Voici une comparaison graphique entre le dernier album de Metallica et d’autres albums connus :
Version CD
Version Guitar Hero
21
c) L’aspect émotif Il n’y a pas d’unité de mesure ou de méthodes de calcul qui permettent d’évaluer l’émotivité d’une pièce de musique. Néanmoins, on sait que des notions telles que l’espace, la profondeur du champ d’écoute, les richesses de variations de texture sonore, les modulations d’amplitude tel que le crescendo et décrescendo (que l’on appelle « nuance » en musique classique) sont des paramètres qui participent à la beauté d’une œuvre. Il est évident que la Loudness War est leur pire ennemi, elle les a grandement altérés ces trente dernières années.
11. Les acteurs de la Loudness War
Il est important de comprendre que les différents acteurs intervenants dans les domaines d’application de la Loudness War interagissent entre eux. Les artistes s’adressent aux studios, aux labels ensuite, qui tentent de diffuser leurs productions aussi bien sur des supports physiques, qu’en radio, ou encore à la télévision. Nous décrirons ici le « fonctionnement interne » de ces différents acteurs, et la façon dont la loudness influence leur comportements respectifs.
22
a. Les artistes
Voici une citation d’un ingénieur du son, extraite du mémoire de Joël Girès : « Etude des changements des pratiques de compression dynamique dans la production musicale « populaire » des années quatre-‐vingts jusqu’à aujourd’hui »
« Souvent les musiciens sont contents du mix dans la régie, et ils emportent une copie avec eux. Quelques jours plus tard, ils téléphonent au studio et demandent pourquoi ils sont obligés de monter le niveau de leur CD par rapport aux "CD du commerce". Et là, t'es battu, la guerre commence... »
Rares sont les artistes possédant les compétences d’un ingénieur du son. Néanmoins, c’est dès l’étape de l’enregistrement qu’apparaissent les premières préoccupations de niveau.
b) Les maisons de disques
Les départements artistes et répertoire des maisons de disque ont pour rôle de découvrir de nouveaux talents. Les meilleurs d’entre eux sont issus d’écoles de commerce plutôt que de studios d’enregistrement. Leur objectif principal est d’arriver à mettre sur le marché des produits compétitifs. Leur premier critère de sélection se situe dans l’évaluation du produit par rapport aux standards de diffusion. Voici un exemple de discours d’un artiste révélateur des méthodes de travail, et des critères de sélection des maisons de disque lui aussi extrait du mémoire de Joël Girès :
“Moi : A la fin, quand le mastering est fait, bon t'écoutes le morceau mais est-ce que tu le compares aussi avec d'autres trucs ? Owen Replay : Ah bien sur, oui. Oui oui. Moi : est-ce que le niveau, c'est un truc que tu regardes ? Owen Replay : Oui, oui. Moi : Est-ce que c'est un truc que tu demandes à l'ingé qui fait le mastering ? Owen Replay : Oui, oui. Moi : Et tu lui demandes quoi ? Owen Replay : Alors, je lui dis, t'as vu le dernier morceau de Guetta ? Je vais te le foutre en plage deux, tu écoutes et il faut qu'on soit au même niveau. T'entends le kick il doit être à ce niveau là. T'entends la snare, elle doit être à ce niveau là, etc., donc au moment où il doit compresser il doit faire attention de pas écraser un élément ou un autre. Mais je me suis arrangé à la base pour que le mix ressemble déjà à... Tu vois ce que je veux dire ? Moi : donc t'as des références que t'as que tu donnes à l'ingé son. Owen Replay : Bien sur, c'est clair. Mais ça en général c'est ce qu'on fait quand on fait les miroirs, quoi. [...] est-ce que je vais comparer, oui seulement dans le cas d'une commande. Y'a une firme de disque qui dit : « oui on voudrait concurrencer le dernier David Vendetta alors il me faut un truc dans le même style ». Alors dans le même style ça veut dire tu copies le truc, tu renverses les mélodies, tu fous le même nombre d'ingrédients, tu changes l'artiste, et on a une mélodie accrocheuse, quoi. Ça c'est une commande. Et là automatiquement je vais tout faire pour que quand on écoute on passe pas pour des cons, quoi.”
23
c) Itunes – Beatport – Spotify – les Web Labels
L’ensemble des diffuseurs musicaux sur le web est soumis aux mêmes contraintes que les maisons de disque travaillant de façon classique. Leur format standard est le MP3.
d) En Radio
De façon comparable au monde de la musique, il existe une véritable compétition entre stations qui n’acceptent pas d’être « moins fortes » que les autres. De plus, les publicités sont surcompressées avant même la diffusion.
ORBAN OPTIMOD
L’Orban Obtimod est l’outil de compression standard et est utilisé dans la plupart des stations radios. Son rôle est de compresser et limiter le signal audio avant la diffusion. A la base, son utilité était uniquement technique, mais les radios on décidé de l’utiliser pour donner une « couleur » à leur son. On peut se poser la question de « pourquoi compresser le signal de façon extrême avant de le limiter ensuite lors de la diffusion ?»
e) En Télé
Auparavant, on pouvait noter une grande différence de niveau entre les programmes et les publicités. En effet, le rôle de la publicité est d’augmenter les ventes d’un produit. Plus on à de chances de bien faire passer le message, plus on a de chances de vendre ce produit. Néanmoins, depuis l’apparition de la norme EBU-‐R128, des directives européennes ont permis d’harmoniser le niveau sonore général de la télévison.
24
f) En cinéma
Vers la fin des années 1990 et avec l'apparition du cinéma multicanal 5.1 aux USA, commence le jeu du "plus fort que moi tu meurs". Jusqu'au moment où des spectateurs portent plainte en prétendant avoir été rendu sourd à l'occasion de la projection d'un film. Aux États-‐Unis, on ne plaisante pas avec les Associations de consommateurs mais les experts nommés par les juges afin d'examiner le bien fondé du Too Loud qui rend sourd, se grattent la tête, ne sachant pas par quel bout aborder scientifiquement le problème. Du temps de l'analogique et du son stéréo optique des années 1980, le problème était plus simple : les sur-‐modulations s'écrasaient dans la « compression de bande » et le report optique ne pouvait dépasser en théorie les 136% de modulation. Arrive le numérique et la nouvelle notion du zéro Full Scale que les ingénieurs du son mettent du temps à bien appréhender... Et le traditionnel zéro Vu (+4 dB en CCIR) se transforme en -‐ 16 puis -‐ 18 et enfin -‐ 20 dBFS au cinéma... Les mixeurs ne résistent pas à la course du fameux « plus blanc que blanc » de Coluche devenu « plus fort que fort » ... Ils ne respectent pas le niveau moyen préconisé du -‐ 18 dBFS de l'époque, ils vont aux limites (le zéro dB FS) croyant ainsi être les plus forts des plus forts...
Dolby Labs y travaille, publie un document au SMPTE Film Conference, le 22 mars 1997 sous le titre: « Are Movies Too Loud? » (par Loan Allen, Vice-‐President Dolby Laboratories Inc). Puis Dolby organise en 1998 au festival de Cannes une table ronde dont le titre est explicite: "Are Movies Too Loud ?"
Rappelons que Dolby Labs est historiquement le premier à avoir établi une relation (ou un rapport) entre le niveau moyen de modulation électrique en analogique (185 Nano Weber/m2) d'un programme sonore et son niveau équivalent de diffusion (le fameux 85 dB SPL).
Dolby Labs s'aperçoit que la tâche est immense, essaye quelques méthodes ou approches de mesure du loudness en constante évolution (en parallèle avec le passage de l'analogique vers le numérique... ainsi que l'émergence vers le milieu des années 2000 des formats de télévision HD). Les différents organismes normatifs (ISO, ITU) et autres organisations (SMPTE, EBU, NAB, etc.) s'agitent et publient sur le sujet.
Il faut savoir qu'une norme avant d'être adoptée est d'abord une recommandation, elles-‐mêmes issue de travaux de maître à penser incontestés. Cela prend, en général, plusieurs années et peut évoluer en fonction des progrès technologiques. »
25
g) Ambiancement sonore :
Avant, la musique s’écoutait dans un lieu calme. De plus en plus, la musique s’écoute dans les transports publics, dans les magasins, etc… Elle sert de plus en plus d’ambiancement sonore. Il a donc fallu trouver un moyen pour que celle-‐ci s’entende dans des lieux bruyants. De plus les systèmes d’écoute dans ces lieux ne sont pas vraiment de qualité et donc on favorise la loudness plutôt que la finesse du son.
« Répondant à la demande des stations de radio, les fabricants de matériel électronique ont d'abord produit des appareils capables d'empêcher le signal audio arrivant aux émetteurs de dépasser les limites admissibles (limiteurs), puis des compresseurs qui suivent automatiquement les variations du signal électrique pour en augmenter progressivement le niveau aux moments où il est plus faible que le maximum, puis des dispositifs plus sophistiqués capable de le faire en privilégiant les bandes de fréquences donnant une plus grande sonie. L'introduction de la technologie numérique a à la fois durci la limite maximale du signal, qu'il n'est absolument plus possible de dépasser, même pour un millième de seconde, et permis des traitements plus élaborés. Ces nouveaux outils rendent accessibles des traitements qui auraient été soit impossibles, soit très longs et coûteux autrefois. Ils sont désormais utilisés de façon quotidienne et routinière, et une musique peut passer à travers plusieurs de ces processeurs avant d'arriver aux oreilles du public. »
12. Etude de cas :
Artiste : Muse Morceau : Madness Album : The 2nd Law (Deluxe Edition) Label : (Warner Bros) J’ai choisi ce morceau pour plusieurs raisons. Au début, le rythme est constitué par des samples et bénéficie d’un traitement plus électronique. Au fur et à mesure de la progression du morceau, des éléments acoustiques interviennent. A la fin, il y a tout un chœur de chanteurs. La richesse des arrangements de cette chanson ainsi que la diversité des éléments qui s’y côtoient me semblent être un contexte idéal pour avoir une vision large au niveau musical. De plus, cette chanson à un grand impact au niveau du public car beaucoup de gens la connaissent. 11.1. Comparatif On possède deux fichiers :
26
1. La version m4a, achetée sur iTunes Stores. Sa durée est de 4.39 minutes. Ce fichier est un codec AAC (Apple Audio Codec) Sa résolution est de 16 bits, 44.1kHz. Son poids est de 9,8 Mo. 2. La version « Lossless », achetée sur le site www.highresaudio.com. Sa durée est de 4.39 minutes. Ce fichier est un FLAC (Frequency Lossles Audio Codec) C’est une version équivalente au master issu du studio de mastering. Sa résolution est de 24 Bits, 96 kHz. Son poids est de 98.8 Mo. 11.2. Import dans Logic Pro Il nous faut maintenant convertir ces deux fichiers en .aif afin de pouvoir les importer dans Logic. Pour convertir le m4a du iTunes Store, on utilise le logiciel Switch. Nous obtenons alors un fichier .aif, 16 bits, 44.1 kHz, qui pèse 49.4 Mo. Pour convertir la version FLAC, on utilise le logiciel Amarra 2.2. Nous obtenons alors un fichier .aif qui pèse 162 Mo. Sa résolution reste de 24 Bits, 96 kHz. 11.3. Premiers constats a) Lorsqu’on importe le fichier .aif issu du FLAC, Logic propose de switcher la fréquence d‘échantillonnage vers 96kHz, celle par défaut étant 44.1kHz.
b) Lorsqu’on importe le .aif issu de la version m4a, il « joue » deux fois plus vite. Ceci résulte d’un problème de correspondance de fréquences d’échantillonage entre les deux versions. Pour remédier à celui ci, on utilise le logiciel Saracon de Weiss, afin de convertir la bitrate du fichier issu du M4a, ainsi que sa fréquence d’échantillonnage vers du 24 Bits, 96 kHz. On obtient alors un fichier .aif, 24bits, 96kHz, qui pèse 161,1 Mo. Ensuite on adapte le tempo de la session Logic à celui du morceau, qui est de 90 bpm. 11.4. Forme d’onde
27
Intro : 5sec-‐16sec
FLAC to AIF m4a to AIF
Middle : 2.29sec-‐2.40sec
FLAC to AIF m4a to AIF
End : 4.05sec-‐4.16sec
FLAC to AIF m4a to AIF
On peut clairement observer une nette différence de formes d’ondes entre les deux fichiers de formats différents. La dynamique générale du morceau est fortement réduite dans la version m4a par rapport à la version FLAC.
28
11.5. Différences perceptives ressenties A l’écoute sur un monitoring de qualité (Genelec 1032), je perçois les choses suivantes :
-‐ La version m4a est fatiguante au bout de quelques secondes -‐ Elle semble aussi « s’écraser » lorsque la voix apparaît -‐ Les transitoires sont plus agressives, mais ont moins d’impact que dans la
version lossless. -‐ Les percussions, en particulier la caisse claire sont plus « fines » dans la version
lossless, et plus « claquantes » dans la version m4a. C’est une conséquence typique d’une compression plus importante sur le bus de sortie. Ceci est valable aussi pour la grosse caisse.
-‐ Il y a aussi un effet de proximité de la voix et de plusieurs instruments que je perçois moins dans la version lossless.
-‐ La version lossless me semble plus « aérée ». -‐ On perçoit mieux les détails, ainsi que les finesses sonores dans la version
lossless. -‐ A la fin du morceau en particulier, lorsque l’ensemble des instruments est
présent, on perçoit très nettement une plus grande amplitude stéréophonique dans la version lossless.
-‐ Toujours à la fin du morceau, on distingue moin bien les différents instruments dans la version M4a que dans la version Lossless dû au manque de clarté.
A l’écoute sur des enceintes plus « grand public » (Logitech de bureau), ou bien en voiture, je perçois beaucoup moins toutes ces différences. Principalement parce que l’environnement bruyant ne me permet pas de me concentrer efficacement sur la musique. Mais aussi, parce que la qualité des enceintes ne permettent pas de rendre toutes ces nuances audibles. Afin de mieux étayer mes constatations, j’ai d’abord fait appel à une personne de mon entourage, professionnel de la musique. Ensuite, j’ai demandé l’avis de mes amis proches, âgés de 16 à 22 ans, qui n’ont pas une oreille d’ingénieur du son.
1) Avis du professionnel de la musique, ingénieur du son : « Je sens nettement la différence de niveau, j’ai l’impression qu’il y a deux à trois dB en plus sur le MP3. Il y’a beaucoup plus « d’air » dans la version Lossless, de définition aussi. C’est plus smooth… Le MP3 est clairement plus « harsh », C’est fatiguant à écouter, j’ai l’impression qu’on gueule dans mes oreilles. On dirait un concert avec un mauvais ingénieur du son à la console.
29
2) Avis des auditeurs : En premier lieu, ils ont préféré la version m4a pour son niveau de sortie supérieur. J’ai donc augmenté le niveau de la version FLAC de 3dB de façon à ce que les deux versions soient perçues au même niveau. Même après cela ils ne changeaient pas d’avis et m’ont donné comme raison : « Ca pête plus, c’est plus « boum »! enfin tu vois quoi ». Mon avis là dessus est que les gens en général « n’écoutent » plus la musique. Ils ne font que « l’entendre ». Sur les cinq auditeurs que j’ai questionné, quatre m’ont avoué ne pas écouter de musique sans faire autre chose en même temps (Sport, travail, conduite, etc). Mon opinion est que mes contemporains n’ont pas eu la chance de grandir avec la Hi-‐Fi. C’est la génération de l’Ipod, du MP3, de Youtube,… Mes parents écoutaient des disques vinyles. Leur éducation d’écoute est différente. 11.6. Différences de niveau -‐ en dBTP : Aucune différence n’est notable. -‐ en dBLuFS : J’ai utilisé pour ceci le WLM (Waves Level Meter) de Waves. Dans la version m4a de l’Itunes store, le calcul sur court terme est supérieur de 4dBLu, celui sur le long terme est supérieur de 3dBLu, et le calcul momentané est supérieur de 3,2dbLu. N.B. : Ce constat rejoint la citation de l’ingénieur du son reprise au point 11.5 11.7. Tests de conversion vers le Mp3 On se trouve confronté ici à un problème de compatibilité de fréquences d’échantillonnages. En effet, le MP3 n’existe pas en 96Khz… Nous devons donc créer une nouvelle Session dans Logic en 48Khz, et ré-‐importer les fichiers aif. crées précédemment, en convertissant leurs fréquences d’échantillonnage en 48 Khz en utilisant à nouveau le logiciel Saracon de Weiss
a) Du losless vers Mp3 320Kbps dans Logic Comparaison -‐Au niveau perceptif On ne perçoit pas vraiment de différence, si pas aucune à l’écoute des deux versions. Elles sont tout à fait similaires.
30
-‐ Analyse du spectre En utilisant le plug-‐in Equick de DMG Audio, j’ai pu observer que les deux spectres ne sont pas tout à fait identiques. Celui du MP3 est supérieur de 5dB dans les infrabasses comparé au spectre du lossless, et est en général d’un niveau supérieur sur l’ensemble du spectre. -‐ Analyse du niveau en dBFS La différence entre les deux fichiers est infime. -‐ Analyse du niveau en dBLuFS En se basant de nouveau sur le plug-‐in WLM il n’y a pas de différence notable. Que ce soit sur le long terme ou le court terme, il n’y a aucune différence entre la version lossless et le MP3 fait sur Logic.
-‐ Poids du fichier La version Lossless pèse 162Mb. La version MP3 pèse 11,2Mb.
b) Méthode alternative du Lossless vers MP3 via Master for Itunes : J’ai donc utilisé « Master for Itunes Droplet » pour faire une conversion en MP3. J’ai obtenu un fichier m4a qui pèse 9,2Mb. Je l’ai ensuite importé dans Logic qui l’a automatiquement converti en un fichier .aif qui pèse 53,8Mb. Il est important de noter que ce fichier pèse moins de la moitié que le fichier original. Comparaison -‐Au niveau perceptif Youri Balcers dit : « Je sens une légère différence. Pas énorme mais je la ressens quand même. Le lossless est celui que je préfère de loin, meilleure définition, une meilleure lisibilité des sons en général, de l’air, de la place entre les différents éléments sonores. J’ai l’impression aussi que le mp3 tiré d eLogic est meilleur que celui du codec iTunes, plus aéré lui aussi. La version iTunes me semble plus « piquante » entre 4 et 7Khz. Et je trouve la version Logic plus « piquante » vers 10, 12 Khz. Au niveau des basses aussi je sens la version iTunes plus ronde, trop ronde même, voire « dull », en tout cas moins bien définie que la version Logic où là je discerne parfaitement le kick de la basse. Au niveau de la dynamique par contre, c’est trop mince que pour être mentionné. Mais dès qu’on switche sur la version iTunes store, en ayant passé du temps à cerner les détails des trois autres versions, c’est frappant à quel point c’est différent : Je n’aime pas du tout. »
31
-‐Analyse du spectre On note quelques différences visuellement. A ce stade-‐ci, je me pose la question de savoir si la différence d’affichage entre les différents analyseurs ne viendrait pas simplement d’un problème de latence. Youri Balcers me dit : « Et moi je suis rassuré de voir que l’analyse de spectre corrobore ce que me dit mon oreille… » -‐Analyse du niveau Il y a une légère différence dans la version MP3, de +0,4 dBTP. -‐Poids du fichier La version Lossless pèse 162MB. La version MP3 du codec Itunes pèse 9,2MB. 11.8. Comparaison entre nos deux versions MP3 (Logic et Master iTUnes Droplet) et la version MP3 du iTunes Store. a) Au niveau perceptif -‐ Ici on perçoit une différence flagrante. La version achetée sur ITunes est plus forte, les transitoires sont écrasées, et ont donc moins d’impact que dans les deux autres versions MP3 (Logic / Master Itunes Droplet). La voix est beaucoup plus proche dans la version d’Itunes et écrase le reste de la musique à cause à son niveau supérieur. Aussi, à la fin du morceau, quand tous les instruments sont présents, on ne distingue plus bien chacuns d’entre eux comme dans les deux autres versions. C’est fatiguant à l’écoute. b) Mesures -‐ Analyse du spectre Mis à part une nette différence de niveau de sortie (environ 3dB), il n’y a pas de grandes différences au niveau des réponses de fréquence. Elles sont même très similaires. -‐ Analyse du niveau SPL En utilisant n’importe quel VU-‐mètre digital, on n’observe pas plus de 0.2dB de de plus sur la version achetée sur ITunes par rapport aux autres. -‐Analyse du niveau dB LUFS Ici la différence est impressionnante. On peut voir qu’il y’a 3.4dBLuFS de plus sur le long terme dans la version achetée sur ITunes et 3.6dBLuFS de plus sur le court terme. Le calcul momentané dans la version achetée est supérieur de 3.2dBLuFS par rapport aux autres. Cependant au niveau du « True Peak » ils sont tous les trois à 0.3dBTP.
11.9. Conclusion
32
Après cette étude de cas on remarque que la version achetée sur Itunes est plus forte et est de moins bonne qualité. On peut en déduire que certaines grosses productions sont masterisées deux fois. Un premier mastering servira au pressage du CD, et un deuxième sera masterisé en vue d’une conversion en MP3, destinée à la vente en ligne, et essentiellement à l’écoute sur des moniteurs ou des casques « bon-‐marché » via des lecteurs MP3.
13. Mouvements collectifs
Depuis plusieurs années on a pu observer un grand nombre de mouvements collectifs contre la « Loudness War », notamment sur le net où ont été créés de multiple forums sur la guerre du niveau, comment y mettre fin, etc… Internet est le premier moyen de communication autour du sujet de la Loudness War. Sur le site Gearslutz.com, qui est la référence dans le domaine, on retrouve un grand nombre d’informations, d’avis en tous genres et de solutions proposées par les utilisateurs. Les avis y sont très divergents, c’est une véritable controverse. Rick Rubin, l’ingénieur de mastering qui a masterisé l’album « Dead Magnetic » de Metallica, est le plus cité dans ces forums. Outre la pétition* pour un remastering de l’album, celui-‐ci est sujet à de nombreuses discussions et tout le monde se demande qui est le véritable responsable. Rick Rubin a paradoxalement reçu un « Grammy Award » de la meilleur production de l’année pour ce disque… Ian Sheperd est cité dans la plupart de ces articles. C’est un ingénieur de mastering professionnel, créateur du site « production advices ». Il est un fervent défenseur de l’amplitude dynamique.
33
En Mars 2010, Ian Sheperd organise la première journée de l’amplitude dynamique (Dynamic Range Day). Cette première journée a été un succès et en 2011, le « Dynamic Range Day » a obtenu le soutien d’entreprises tel que SSL et Shure, ainsi que de l’ingénieur de mastering Bob Ludwig. Même si cela peut paraître paradoxal, SSL offre lors de cette journée un « Master bus compressor »...
14. Controverse -‐ Emmanuel Deruty
a) Emmanuel Deruty Emmanuel Deruty est un ingénieur du son français travaillant notamment comme rédacteur pour le magazine « Sound on Sound ». Il est également compositeur de musiques de films et consultant en musicologie à l’INRIA (L'Institut National de Recherche en Informatique et en Automatique).
b) Article Sound on sound En Juillet 2012, Emmanuel Deruty publie un article paru dans le magazine « Sound on Sound » au sujet de la « Loudness War ». Il part du postulat que ce que l’on voit sur la forme d’onde d’un morceau n’est pas nécessairement ce que l’oreille perçoit. Les musiques récentes, tels que les albums de Lady Gaga, sonnent en effet beaucoup plus fort, mais il n’y a cependant pas moins de “nuances” dans l’ensemble que dans un album des années quatre-‐vingt.
34
Au contraire, dans les musiques récentes il y a beaucoup plus de nuances au niveau du “volume” sonore que dans un morceau des Beatles par exemple. Il propose un autre système d’analyse: la matrice de similarité. Celle-‐ci se base sur deux paramètres. En abscisse: le niveau En ordonnée: le temps Lorsqu’il y a similarité l’affichage est noir et lorsqu’il y a des nuances l’affichage est blanc. Ces matrices de similarité représentent donc les nuances de niveau entre deux morceaux. A gauche, celle du morceau “Come together” des Beatles enregistré en 1969, et à droite celle du morceau “Telephone” de Lady Gaga enregistré en 2010.
35
On voit nettement que dans le morceau de Lady Gaga les différences d’amplitude de niveau sont bien plus importantes que dans celui des Beatles. Afin de confirmer ces résultats, Emmanuel Deruty a ensuite demandé au Dr Damien Tardieu, spécialiste du traitement du signal à l’IRCAM à Paris d’effectuer des analyses similaires, sur un corpus de musique totalement différent. Celui-‐ci a analysé 20000 chansons choisies au hasard dans le catalogue d’EMI. Ces analyses ont montré que l’amplitude dynamique des morceaux n’a pas changé même si le « limiting » est beaucoup plus important. Selon Mr Deruty, il n’y a aucun doute à ce sujet : « Contrairement à ce qui est souvent dit, il n’y a pas eu de diminution évidente de l’amplitude dynamique en raison de la guerre du niveau ainsi que les limiteurs « Brickwall » dans les productions musicales ».
c) « Syndrome » du « C’ETAIT MIEUX AVANT » Pendant une conférence à l’université de Rennes, Emmanuel fait allusion à un phénomène historique en donnant des exemples similaires au problème de la « Loudness War ».
36
En 1322, le pape Jean XXII a dit : « Certains praticiens de cette nouvelle école, qui ne pensent plus qu’au temps mesuré, composent des mélodies de leur propre création, en utilisant un nouveau système de hauteur qui va à l’encontre de la tradition (…) Nous interdisons absolument ces usages pendant l’office. » En résumé, le pape Jean XXII n’aimait pas du tout le fait d’utiliser un métronome pour composer de la musique, ce qui de nos jours est évident. En 1600, le chanoine Artusi a dit : « Les sens sont devenus fous, et c’est les résultats qu’obtiennent délibérément tous ces faiseurs de neuf qui, jours et nuits, s’escriment sur leurs instruments à chercher des effets nouveaux (…) Ces compositions sont contraires à ce qu’il y a de beau et de bon dans l’art de la musique » C’est ce que l’on entend encore aujourd’hui à propos des musiques récentes. En 2006, Bob Dylan a dit « Ces nouveaux disques sonnent mal (…) Je ne connais personne qui ait fait un disque qui sonne correctement depuis 20 ans (…) La musique d’aujourd’hui ne vaut rien ! »
15. Impact sur les nouveaux styles musicaux
Nous savons maintenant que la plupart des courants artistiques musicaux contemporains ont comme point commun de pousser le niveau dans ses derniers retranchements. Les artistes les plus connus dans ce domaine sont Dada Life, Skrillex, Tïesto ou encore Afrojack. La Loudness est une composante essentielle de leur démarche artistique. Il existe d’ailleurs aujourd’hui des plug-‐in’s dont l’unique objectif est d’utiliser la Loudness comme élément musical. Par exemple les « One knob » de Waves ou encore le « Sausage Fattener » de Dada Life développé par Taylored Noise. Voici l’interface du plug in :
37
Il n’y a que trois potentiomètres : -‐ un qui sert à rendre le son plus « gros » => Fatness -‐ un qui sert à donner une couleur au son => Color -‐ un gain d’entrée C’est un compresseur/ limiteur qui rajoute de la distorsion.
16. Nouvelles normes techniques (Norme ebu r-‐128 et iTunes Soundcheck)
EBU R-‐128 : Le 1er janvier 2012 est entrée en vigueur une nouvelle norme audio pour tous les mixages destiné à la diffusion télévisée. Ces nouvelles normes sont reprises dans un document fourni par la CST (Commission Supérieure Technique de l'image et du son). Nous allons en résumer les grandes lignes. Pour caractériser le signal audio, on utilise les paramètres suivants :
a) Mesure du « Loudness » du programme (program loudness) b) L’excursion du « Loudness » (loudness range) c) Niveau crête du signal (maximum True Peak level)
Il existe trois types de mesures : • La mesure instantanée (momentary loudness) : fenêtre glissante de 400ms • La mesure « short term » : fenêtre glissante de 3s • La mesure infinie (integrated loudness) : sur toute la durée du programme La valeur de la mesure de la « Loudness » du programme est normalisée à -‐23dBLUFS avec une marge de tolérance de +-‐ 1LU. L’échelle LUFS est équivalente à l‘échelle LKFS (courbe de pondération K ou R2LB) avec la correspondance suivante : è 0 LU = -‐23 dBLUFS Deux échelles sont retenues pour le metering : EBU +9scale, l’échelle par défaut, allant de -‐18 LU jusqu’à +9 LU EBU +18scale, allant de -‐36 LU jusqu’à -‐18 LU Le signal audio doit être mesuré dans son intégralité, sans considérer des éléments spécifiques tels que les dialogues. La mesure doit intégrer l’utilisation du gate, dont le seuil relatif est de 10 LU en dessous de la valeur de la « Loudness », obtenue par mesure instantanée (400ms). A noter aussi la présence d’un gate pour les silences, dont le seuil est fixé à -‐70 dBLUFS.
38
La « Loudness range » (LRA), traduit l’excursion du Loudness au cours du programme, l’algorithme de mesure retenu fonctionne sur la distribution statique des valeurs entre 5% et 95%, excluant ainsi les valeurs extrêmes. Le LRA n’a pas de valeur imposée dans la norme R128, il est juste recommandé de ne pas dépasser 20 LU pour la diffusion broadcast de programmes avec de grandes dynamiques. Itunes Soundcheck : Le « Sound Check » d’Itunes est conçu pour permettre aux utilisateurs de ce lecteur de fichiers digitaux d’écouter toutes leurs chansons au même niveau sonore. Comment ca marche ? Voici les informations fournies par Apple : « Lorsque Sound Check est allumé, iTunes scanne les morceaux de la bibliothèque Itunes et calcule les caractéristiques de leur niveau de lecture. Quand de nouvelles chansons sont ajoutées, iTunes calcule leurs informations en arrière-‐plan. Ces données sont stockées, soit dans la "normalisation des informations" ID3 tag, soit la base de données iTunes Music Library. Les données audio des fichiers musicaux ne sont jamais modifiées. Si on encodez ou "ripe" un morceau avec iTunes, le niveau de contrôle du son est stocké dans ID3 de la chanson balises. Pour les morceaux qui ont été encodés avec iTunes 1 ou 2, ou une autre application, les niveaux de vérification sonores sont stockées dans la base de données iTunes Music Library. Lorsque Sound Check est éteint, si vous mettez Sound Check hors tension, les données sonores stockées pour chaque chanson est ignoré, mais pas supprimé de la bibliothèque musicale iTunes ou les balises ID3 ».
39
17. Sonnox (Fraunhofer Pro-‐Codec)
a) Présentation Ce plug-‐in de la marque « Sonnox » permet de simuler l’encodage et le décodage de signaux audio de haute fidélité vers des codecs de compression, et ceci en temps réel. à Codecs pris en charge:
-‐ MP3, Apple iTunes AAC +, AAC-‐LC, HE-‐AAC et HE-‐AAC v2. -‐ Mp3 Surround, le MPEG Surround, AAC-‐LC multicanal, HE-‐AAC multicanal. -‐ Mp3 HD et HD-‐AAC (sans perte Codecs).
b) Fraunhofer Institute : La « Fraunhofer-‐Gesellschaft » est un organisme allemand spécialisé dans la recherche en sciences appliquées. Son nom vient du physicien Joseph von Fraunhofer. Il regroupe 57 instituts répartis sur 40 sites à travers l'Allemagne, chacun spécialisé dans un domaine de recherche particulier. Il emploie 13 000, personnes ce qui en fait l'un des principaux organismes de recherche au niveau international. Son financement est assuré en partie par l'État (le gouvernement fédéral ainsi que les Länder « possèdent » l'organisme), mais les deux tiers du budget proviennent de contrats de recherches passés avec des industriels. Le nom officiel est Fraunhofer-‐Gesellschaft zur Förderung der Angewandten Forschung e.V. (de l'allemand : « Société Fraunhofer pour le soutien à la recherche appliquée »). L'organisme est connu pour être à l'origine, avec Philips et le CCETT de l'algorithme de compression MP3 ainsi que de sa normalisation. L'institut détient une part importante des droits liés à son utilisation, les autres droits étant détenus par Philips, France Télécom et Technicolor.
40
18. L’évolution probable Les capacités de stockage des fichiers numériques augmentent constamment, tandis que leurs supports tendent à se miniaturiser. D’autre part, les vitesses de transfert de données numériques sur les réseaux ne font que s’accroître. Le MP3 est un format inventé afin de palier à la lenteur des réseaux de l’époque. Des sites tel que : Hdtracks.com, Linnrecords.com, Highresaudio.com sont spécialisés dans la vente de musique de haute résolution. Leur catalogue augmente tous les jours et leur succès est grandissant. Tout porte à croire que les évolutions technologiques permettront dans peu de temps de consommer de la musique de bonne qualité sans les contraintes inhérentes au MP3. La question qui se pose, alors que nous en sommes au point ou les supports audio sont arrivés « au bout de leur headroom », est la suivante : « Peut-‐on faire sonner ça plus fort ? »
41
19. Conclusion Avant de commencer des études d’ingénieur du son, je n’avais jamais entendu parler de la Loudness War. Mon manque d’éducation musicale et de connaissance du son au début de mes études, m’empêchait de la comprendre. Néanmoins l’envie, la curiosité, et la passion de la musique m’ont poussé à entreprendre ce cursus. Une des premières choses que j’ai remarqué, était l’importance de ce sujet. C’est ce qui m’a poussé à la rédaction de ce mémoire. En l’abordant, je n’avais que des idées préconçues. Par exemple, toute la musique que j’écoutais à l’époque était sur-‐compressée. Je n’avais pas saisi le gouffre séparant mes goûts musicaux des pratiques communes chez les ingénieurs du son expérimentés. J’ai très vite compris que la Loudness War est une préoccupation majeure du domaine du traitement du son. J’ai par exemple constaté que des ingénieurs ou des producteurs se déclarant opposés à cette pratique terminaient néanmoins leurs productions dans des studios où celle-‐ci est commune… Mon opinion est la suivante : L’intensité de la Loudness est une question de goût. C’est un « outil musical ». Que l’on soit pour ou contre, c’est une donnée de base dans la musique actuelle, que l’on ne peut contourner. Pour les plus anciens, il est difficile d’admettre que les temps changent, et ce n’est pas un phénomène nouveau. Pour les néophytes, le manque d’éducation leur empêche de saisir la profondeur du sujet. La musique est un art en constante évolution, et c’est une bonne chose. J’imagine et j’espère qu’après le débat sur la Loudness War en apparaîtra un autre, nouveau, tout aussi fascinant, et qui remettra à nouveau en question énormément d’idées préconçues. Car je pense que c’est comme cela que les choses avancent. En conclusion je pense que la guerre du niveau est terminée, et qu’il n’y a pas vraiment de vainqueur. C’est juste une question d’évolution… Rédiger ce mémoire a fait changer mon point de vue sur ce sujet, et l’a grandement enrichi. Mes opinions au départ de ce travail sont très différentes à l’heure où je rédige cette conclusion. Là encore, c’est une évolution…
42
20. Webographie et Bibliographie
Webographie :
1. http://www.hearingprotech.com 2. http://fr.wikipedia.org/wiki/Sonie 3. http://tech.ebu.ch/loudness 4. http://www.aes.org 5. http://www.sylvain-‐audio.fr/fr/services/formation/63-‐nouvelles-‐normes-‐
audio 6. http://www.dr.loudness-‐war.info 7. http://homerecording.com/bbs/general-‐discussions/recording-‐
techniques/phil-‐spector-‐wall-‐sound-‐155146/ 8. http://productionadvice.co.uk/loudness-‐means-‐nothing-‐on-‐the-‐radio/ 9. http://www.maintenancehf.fr/Maintenance_HF/Traitement_de_son.html 10. http://www.soundonsound.com/sos/sep11/articles/loudness.htm 11. http://productionadvice.co.uk/about/ 12. http://fr.audiofanzine.com/mastering/medias/videos/a.play,m.17394.html 13. http://www.lesonmulticanal.com/2010/09/09/la-‐recommandation-‐r128/ 14. http://www.sonnoxplugins.com/pub/plugins/products/pro-‐codec.htm 15. http://en.wikipedia.org/wiki/Audio_mastering 16. http://www.sonalyse.fr/portals/0/psychoacoustique.pdf 17. http://en.wikipedia.org/wiki/Psychoacoustics 18. http://www.gearslutz.com 19. http://images.apple.com/itunes/mastered-‐for-‐
itunes/docs/mastered_for_itunes.pdf 20. http://www.lesonmulticanal.com/2010/09/09/la-‐recommandation-‐r128/ 21. http://www.head-‐fi.org/t/367375/itunes-‐sound-‐check-‐any-‐affect-‐on-‐sound-‐
quality 22. http://mastering-‐media.blogspot.be/2008/09/metallica-‐death-‐magnetic-‐
stop-‐loudness.html 23. http://mastering-‐media.blogspot.be/2009/02/why-‐rick-‐rubin-‐deserves-‐his-‐
producer-‐of.html 24. http://www.biography.com/people/rick-‐rubin-‐507309 25. http://www.turnmeup.org Bibliographie :
1. « Son et Enregistrement » -‐ Edition EYROLLES par Francis Rumsey et Tim Mc Cormick
2. Mémoire de Sociologie de Joël Girès; Interview du producteur Owen Replay
3. Le loudness par William Flageollet 4. EBU – Recommandation R 128 « Loudness normalisation and permitted
maximum level of audio signals » (Geneva August 2011)
43
21. Remerciements Je tiens à remercier chaleureusement pour leur aide :
-‐ Mr Thy pour son cours d’introduction sonore
-‐ Mr Luc Tytgat pour son cours très complet sur le numérique
-‐ Mr Emmanuel Deruty pour les liens qu’il m’a fourni
-‐ Le groupe de musique électronique « Dada Life » pour leur réponse rapide suite au mail que je leur ai envoyé
-‐ Le studio Musicom qui m’a permis d’utiliser une partie de leur infrastructure
-‐ Mr Youri Balcers pour m’avoir guidé dans mes recherches, et aidé à la
rédaction de ce travail