Vous aurez sans doute reconnu dans la photo de couverture, une évocation du merveilleux film de Fritz Lang, Metropolis. Mais peut-être ne savez-vous pas que, si on peut voir aujourd'hui ce film en entier, c'est grâce à l'Argentine qui avait conservé une version complète (au format 16 mm) contenant les 25 minutes que l’on croyait perdues. Aujourd'hui, on peut voir ce chef-d'œuvre absolu du cinéma en entier.

Informations sur la musique numérique

Comme annon­cé dans l’article sur la musique trichée, voici quelques élé­ments d’explication pour aider ceux qui ne sont pas au fait de la musique sous forme numérique.
Nous abor­derons la chaîne musi­cale analogique et com­ment on la con­ver­tit en musique numérique. Des élé­ments sur les for­mats de com­pres­sion et les capac­ités réelles des for­mats numériques seront égale­ment don­nés. C’est un peu tech­nique, mais il y a quelques idées reçues qu’il me sem­blait utile de revoir.

La musique est un phénomène analogique

La musique est une forme par­ti­c­ulière de sons qui se dis­tingue du bruit par une cer­taine forme d’organisation. J’en par­le dans mes cours de musi­cal­ité et je ne souhaite pas radot­er.
Ces sons sont donc des vibra­tions, plus ou moins har­monieuses, qui parvi­en­nent à nos oreilles, voire au corps, en entier, notam­ment pour les bass­es fréquences.

Fréquence d’un son

On représente l’onde sonore par une courbe sinu­soïde pour un son réguli­er (une fréquence pure). Si la courbe s’alterne 2000 fois par sec­onde, on par­le de fréquence de 2000 Hz.

Le Hertz est l’unité de mesure de la fréquence.

À gauche, les infrasons et à droite, les ultrasons sont les fréquences que ne capte pas l'oreille humaine.
À gauche les infra­sons et à droite les ultra­sons sont les fréquences que ne capte pas lor­eille humaine

Une bonne oreille humaine est réputée pou­voir enten­dre des fréquences com­pris­es entre 20 Hz (20 vibra­tions par sec­onde) et 20 kHz (20 000 vibra­tions par sec­onde).
Pour les fréquences plus graves, les infra­sons, le corps peut les ressen­tir (trem­ble­ments de terre, par exem­ple). Pour les plus aigus, les ultra­sons, pas de chance, c’est le domaine des chauves-souris et des chiens.
On notera qu’au fur et à mesure que les cils de la cochlée dis­parais­sent, la sen­si­bil­ité de l’oreille baisse, notam­ment pour les plus hautes fréquences.

Volume d’un son

L’autre élé­ment impor­tant pour décrire un son, c’est son vol­ume. C’est-à-dire l’amplitude des ondes qui parvi­en­nent à nos sens.

L'onde sonore parvient à l'oreille comme une succession de vibrations. Plus elles sont amples et plus le son est fort.
Londe sonore parvient à lor­eille comme une suc­ces­sion de vibra­tions Plus elles sont amples et plus le son est fort

Si les ampli­tudes sont trop faibles, l’oreille n’est pas capa­ble de les détecter. Si elles sont trop fortes, des dom­mages irréversibles aux oreilles peu­vent advenir.
Le déci­bel (dB) est l’unité de mesure du vol­ume sonore. On par­le de pres­sion acous­tique.
Pour évo­quer le niveau sonore pour la dif­fu­sion de la musique, il y a plusieurs paramètres à pren­dre en compte et notam­ment la durée du son fort. J’y con­sacr­erai un autre arti­cle… Pour l’instant, il importe de se sou­venir qu’un son supérieur à 120 dB (seuil de la douleur) provoque des dom­mages irréversibles et qu’au-dessus de 85 dB, il con­vient de lim­iter le temps d’exposition.
Un dernier point, la pres­sion sonore dou­ble tous les 3 dB. Ain­si, un son de 85 dB est deux fois plus fort qu’un son de 82 dB.

Principe d’une chaîne musicale analogique

Je ne par­ti­rai pas de l’enregistrement que nous avons déjà évo­qué, seule­ment de la repro­duc­tion.
Les sup­ports prin­ci­paux de l’enregistrement analogique pour la musique sont le disque et la bande mag­né­tique. Pour le disque, ce sont les ondu­la­tions du sil­lon qui sont trans­for­mées en onde sonore.

Pointe de lecture (en saphir ou diamant industriel) dans un sillon de microsillon. À droite, l'image représente environ 0,3 mm de large. Les aspérités du bord du disque sont les bords du chemin. Les différences de profondeur servent à coder un second canal (stéréo).
Pointe de lec­ture en saphir ou dia­mant indus­triel dans un sil­lon de microsil­lon À droite lim­age représente env­i­ron 03 mm de large Les aspérités du bord du disque sont les bor­ds du chemin Les dif­férences de pro­fondeur ser­vent à coder un sec­ond canal stéréo

Dans les pre­miers sys­tèmes, un grand pavil­lon ten­tait de dif­fuser le bruit de l’aiguille dans les sil­lons du disque. Les sys­tèmes élec­triques, en ampli­fi­ant ce sig­nal, ont per­mis de sonoris­er plus con­fort­able­ment n’importe quel espace.
La pointe de lec­ture, une aigu­ille pour les dis­ques 78 tours, puis un dia­mant pour les microsil­lons subit les ondu­la­tions du sil­lon et les trans­met à un dis­posi­tif élec­tro­mag­né­tique qui détecte les vibra­tions pour mod­uler un courant élec­trique.

Un schéma simplifié du principe de fonctionnement d'une cellule platine disque vinyle (stéréo). La pointe de lecture (diamant) fait se déplacer le cantilever relié à un pivot. Ce pivot porte deux aimants dont les déplacements sont détectés par 4 entrefers reliés chacun à une bobine. Le courant circulant dans les bobines est modulé en fonction des mouvements des aimants. Ce signal électrique est transmis par 4 fils au système de décodage et préamplification afin de restituer le signal sonore stéréo.
Un sché­ma sim­pli­fié du principe de fonc­tion­nement dune cel­lule pla­tine disque vinyle stéréo La pointe de lec­ture dia­mant fait se déplac­er le can­tilever relié à un piv­ot Ce piv­ot porte deux aimants dont les déplace­ments sont détec­tés par 4 entre­fers reliés cha­cun à une bobine Le courant cir­cu­lant dans les bobines est mod­ulé en fonc­tion des mou­ve­ments des aimants Ce sig­nal élec­trique est trans­mis par 4 fils au sys­tème de décodage et préam­pli­fi­ca­tion afin de restituer le sig­nal sonore stéréo

Il existe des sys­tèmes dif­férents (bobine mobile, par exem­ple) dont vous trou­verez une ver­sion très sim­pli­fiée ici… Sim­pli­fiée, car il y a une seule bobine au lieu des dif­férentes bobines de détec­tion des mou­ve­ments hor­i­zon­taux et ver­ti­caux, indis­pens­ables pour la stéréo. Le mou­ve­ment hor­i­zon­tal donne le sig­nal du canal gauche et le change­ment de pro­fondeur per­met de déduire le canal de droite (gauche [H] moins ver­ti­cal).

Ce qui est impor­tant à tenir en compte, c’est que le sig­nal dans les sys­tèmes analogiques est tou­jours sous forme de vari­a­tion d’onde. C’est un phénomène con­tinu. La pointe de lec­ture de la pla­tine tourne-dis­ques se déplace par vibra­tions. Ces vibra­tions sont trans­mis­es sous forme de vari­a­tion de poten­tiel élec­trique par la cel­lule. Ces vari­a­tions sont ampli­fiées par l’amplificateur analogique, qui envoie un sig­nal élec­trique plus fort aux enceintes dont les bobines des haut-par­leurs vont se déplac­er en fonc­tion de ce qu’elles reçoivent. Par exem­ple, quand l’onde est à son max­i­mum, la bobine va pouss­er la mem­brane du haut-par­leur vers l’avant et quand l’onde est à son max­i­mum, la bobine va vers l’arrière. Le mou­ve­ment de la mem­brane du haut-par­leur, sol­idaire de la bobine, va pouss­er l’air pour le met­tre en mou­ve­ment, ce qui va pro­duire dans notre oreille une sen­sa­tion de son.

Schéma d'un haut-parleur (découpé). Lorsque la bobine se déplace, elle entraîne avec elle la membrane (cône et dôme anti-poussière). Le mouvement est transmis à l'air ambiant et le son peut se propager jusqu’aux oreilles des auditeurs.
Sché­ma dun haut par­leur découpé Lorsque la bobine se déplace elle entraîne avec elle la mem­brane cône et dôme anti pous­sière Le mou­ve­ment est trans­mis à lair ambiant et le son peut se propager jusquaux oreilles des audi­teurs

Une petite mise en garde. Si on utilise deux haut-par­leurs, il faut veiller à les branch­er dans le même sens pour éviter qu’un aille vers l’avant pen­dant que l’autre va vers l’arrière. Les ondes pro­duites par les haut-par­leurs tendraient à s’annuler, le max­i­mum de l’un cor­re­spon­dant au min­i­mum de l’autre. Voir un court topo sur la ques­tion. On utilise d’ailleurs ce phénomène pour les casques à réduc­tion dynamique de bruit, mais c’est une autre his­toire…

Le cas du magnétique

En plus des procédés pure­ment mécaniques ou élec­tromé­caniques, des procédés de stock­age mag­né­tiques ont été inven­tés. Dans les ban­des mag­né­tiques analogiques, la mag­néti­sa­tion de la bande est plus ou moins forte. Ces vari­a­tions, comme celle de la pointe de lec­ture, peu­vent être ampli­fiées et envoyées dans le sys­tème de dif­fu­sion sonore. Nous ver­rons, toute­fois, que la bande mag­né­tique a survécu à l’ère analogique pour rejoin­dre l’ère numérique que nous allons évo­quer main­tenant.

L’arrivée du numérique

Le sig­nal analogique est très sim­ple à gér­er. Il suf­fit de respecter les car­ac­téris­tiques du sig­nal élec­trique, le plus fidèle­ment pos­si­ble, de la pointe de lec­ture de la pla­tine, jusqu’à la bobine du haut-par­leur.
Le numérique exploite un autre principe. On mesure les car­ac­téris­tiques d’un son à un moment don­né. On mesure notam­ment son ampli­tude et ses fréquences (j’écris « ses » fréquences, car les sons musi­caux sont des mélanges var­iés de fréquences et pas une onde sinu­soï­dale pure).

La courbe de fréquence est ici le résultat de la superposition de toutes les fréquences de la musique.
La courbe de fréquence est ici le résul­tat de la super­po­si­tion de toutes les fréquences de la musique

Cette mesure s’effectue à un moment don­né. Les infor­ma­tions peu­vent être retran­scrites sous forme numérique, puisqu’on les a mesurées. On recom­mence une frac­tion de sec­onde plus tard et ain­si de suite pour toute la durée de la musique. 
Cette opéra­tion qui con­siste à divis­er la musique en tranch­es s’appelle la quan­tifi­ca­tion.

En gris, la courbe de la musique. La ligne brisée en escaliers représente le signal numérique.
En gris la courbe de la musique La ligne brisée en escaliers représente le sig­nal numérique

Pour bien com­pren­dre, regardez l’espace entre les deux lignes rouges ver­ti­cales. C’est un instant de la musique. La ligne verte hor­i­zon­tale dans la colonne rose indique la fréquence iden­ti­fiée par la numéri­sa­tion. On se rend compte, toute­fois, que la courbe analogique (en gris) est ascen­dante durant le temps de cette quan­tifi­ca­tion.
Il y aura donc une moyenne et pas une valeur exacte.
Lors de la resti­tu­tion, on effectue l’opération inverse. On repro­duit la fréquence enreg­istrée et on extra­pole l’évolution jusqu’à la valeur suiv­ante (ici, le palier vert à droite de la zone rose).

L'aspect d'une "courbe" numérisée à différents niveaux d'échelle. On se rend compte que, dans la capture d'écran du bas, on voit les « points », les valeurs mesurées.
Laspect dune courbe numérisée à dif­férents niveaux déchelle On se rend compte que dans la cap­ture décran du bas on voit les  points  les valeurs mesurées

On pour­rait penser que ces escaliers déna­tureront la musique. Cela peut être le cas, mais pour éviter cela, on mul­ti­plie les mesures. Pour les CD, c’est 44 100 fois par sec­onde. Pour les DVD 48 000 fois par sec­onde. C’est la fréquence d’échantillonnage.
Ces échan­til­lons rap­prochés per­me­t­tent de repro­duire des sons jusqu’à une fréquence sen­si­ble­ment égale à la moitié de cette fréquence d’échantillonnage, soit 22 kHz et 24 kHz, des valeurs supérieures aux capac­ités des oreilles humaines.

Le stockage de l’information de volume

La quan­tifi­ca­tion, ce qui n’apparaît pas dans mon graphique précé­dent, mesure aus­si le vol­ume de la musique. C’est essen­tiel, car les nuances sont un élé­ment majeur de la musique, enfin, de la plu­part des musiques…

Le volume de l’information à stocker

On a donc dans chaque case, pour chaque mesure, de nom­breuses infor­ma­tions. Pour les stock­er, il fal­lait de nou­veaux types de sup­ports. Le CD est le sup­port qui a per­mis la général­i­sa­tion de la musique numérique. Les stu­dios d’enregistrement numériques util­i­saient eux des mag­né­to­phones mul­ti­p­istes à bande, mais c’est un autre domaine.
Ce sup­port reçoit de la musique échan­til­lon­née à 44,1 kHz et sur 16 bits. C’est-à-dire que chaque mesure peut être codée avec 65,536 valeurs dif­férentes.
Cela per­met de stock­er des fréquences de 20 à 20 kHz et des écarts de dynamique de 90 dB.
Ces valeurs sont suff­isantes pour attein­dre les per­for­mances des meilleures oreilles humaines, tout en offrant un rap­port signal/bruit incroy­able pour l’époque (même si dans le domaine de l’enregistrement numérique, le Dol­by fai­sait des mir­a­cles en étant dans la même gamme de rap­port signal/bruit…).
Il y avait tout de même un point noir pour les util­isa­teurs lamb­das. Il n’y avait pas de sys­tème d’enregistrement grand pub­lic per­me­t­tant de manip­uler facile­ment ces énormes quan­tités d’informations.
Des enreg­istreurs de CD sont bien apparus, mais ils étaient lents et moyen­nement fiables. Les enreg­istreurs DAT étaient vrai­ment chers. Ils util­i­saient des ban­des mag­né­tiques, ce qui per­me­t­tait de faciliter les opéra­tions d’enregistrements, mais en lec­ture et avec un accès séquen­tiel (il faut faire défil­er la bande jusqu’au point qui nous intéresse, comme avec les cas­settes Philips).
Peu de temps après, le Mini­Disc résolvait ces deux prob­lèmes. Il avait la facil­ité d’usage pour l’enregistrement d’un mag­né­to­phone à cas­settes, mais son accès aléa­toire per­me­t­tait un accès instan­ta­né et indexé à la musique présente sur le Mini­Disc.
Dans mon cas, cela a été mon sup­port favori pour numéris­er les dis­ques Shel­lac. Augus­to, un DJ parisien orig­i­naire de Bar­iloche, l’utilisait égale­ment en milon­ga.

L’informatique musicale

Aujourd’hui, la qua­si-total­ité des DJ utilisent un ordi­na­teur. J’ai, je pense, été un des pre­miers à le faire, tout d’abord avec un ordi­na­teur tour qu’il fal­lait trib­aller avec son écran, écran qui, même en 15 pouces, était lourd et encom­brant.
Je rêvais donc d’un ordi­na­teur portable, mais dans les années 90, c’était coû­teux et les dis­ques durs étaient très petits. Un disque dur de 40 Mo per­me­t­tait de stock­er un seul tan­go au for­mat WAV… J’avais un disque dur SCSI de 160 Mo (un mon­stre pour l’époque), mais cela était bien sûr trop lim­ité. C’est alors que je suis passé au MP3 à 128 ou 192 kbit/s, ce qui per­me­t­tait de stock­er 10 fois plus de musique. J’ai alors investi dans un lecteur Syquest et une flopée de dis­ques de 88 Mo et dans mon pre­mier ordi­na­teur portable. Un truc avec un écran mono­chrome, mais offert avec une souris « Colani » et une cal­cu­la­trice du même design­er…

Mon premier ordinateur portable et un lecteur Syquest avec des cartouches de 88 Mo. L’ordinateur avait un processeur 486DX2 à 66 MHz, 8 Mo de RAM et 540 Mo de disque dur. Je ne sais pas où est passé cet ordinateur, mais il me reste encore des Syquests avec des cartouches de 88 Mo et de 200 Mo. En recherchant une photo de l’ordinateur sur Internet, j’ai même retrouvé ses caractéristiques.
Mon pre­mier ordi­na­teur portable et un lecteur Syquest avec des car­touch­es de 88 Mo Lordinateur avait un processeur 486DX2 à 66 MHz 8 Mo de RAM et 540 Mo de disque dur Je ne sais pas où est passé cet ordi­na­teur mais il me reste encore des Syquests avec des car­touch­es de 88 Mo et de 200 Mo En recher­chant une pho­to de lordinateur sur Inter­net jai même retrou­vé ses car­ac­téris­tiques

Le sys­tème deve­nait viable et, vers 2000, j’ai inau­guré ce portable et les Syquests avec Winamp, un logi­ciel qui per­me­t­tait égale­ment de chang­er la vitesse de la musique. Roy­al, non ? Un disque de 1 Go en interne quelques années plus tard m’a per­mis d’avoir plus de musique avec moi. Aujourd’hui, je suis passé à 4 To…
Tout cela pour dire que le MP3, qui est un retrait par rap­port aux capac­ités du CD a été sal­va­teur pour utilis­er l’informatique en milon­ga.
Le MP3 devait égale­ment se dévelop­per à cause des faibles per­for­mances d’Internet de l’époque, même si j’avais Numéris, un sys­tème qui per­me­t­tait d’atteindre 64, voire 128 kbit/s en agrégeant deux canaux, mais en dou­blant aus­si le prix de la com­mu­ni­ca­tion…
Aujourd’hui, avec l’ADSL ou la fibre, on a oublié ce temps où il fal­lait des heures pour les trans­ferts et qu’ils étaient fac­turés à la minute…

Comment le MP3 a permis de réduire la taille des fichiers

Un tan­go au for­mat WAV, qual­ité CD, occupe env­i­ron 30 Mo. Un fichi­er MP3 à 128 kbit/s occupe env­i­ron 3 Mo, soit 10 fois moins que le fichi­er sans com­pres­sion.

Ce tableau présente la quantité d’information à stocker en fonction de ses caractéristiques (Fréquence d'échantillonnage et résolution). Encadré en rouge, le CD (piste mono). Il faut multiplier par deux pour un fichier stéréo (1411 kbit/s).
Ce tableau présente la quan­tité dinformation à stock­er en fonc­tion de ses car­ac­téris­tiques Fréquence déchan­til­lon­nage et réso­lu­tion Encadré en rouge le CD piste mono Il faut mul­ti­pli­er par deux pour un fichi­er stéréo 1411 kbits

Un fichi­er MP3 stéréo en qual­ité « CD », 44,1 kHz et 16 bits devrait faire égale­ment 30 Mo s’il n’avait pas de com­pres­sion. Un fichi­er audio stéréo au for­mat CD demande un débit de 1411 kbit/s. Le meilleur MP3 est lim­ité à 320 kbit/s. Il faut donc com­primer env­i­ron 4 fois le fichi­er pour le faire entr­er dans son for­mat.
Cela se fait en sup­p­ri­mant des don­nées estimées inutiles ou pas utiles. Sur une musique rel­a­tive­ment sim­ple, c’est réal­is­able, mais plus com­plexe pour de la musique plus riche.
Si on choisit un débit plus faible, par exem­ple 128 kbit/s, et que l’on a con­servé les valeurs ini­tiales de 44,1 kHz et 16 bits, il faut donc aug­menter très sen­si­ble­ment la com­pres­sion et là, les pertes com­men­cent à s’entendre, comme vous avez pu l’écouter dans mon arti­cle « Détecter la musique trichée ». https://dj-byc.com/detecter-la-musique-trichee/

Taille relative des boîtes à musique

Les "boîtes" bleues montre les capacités d'enregistrement, sans compression. À gauche, trois formats. le 78 tours, le 33 tours et le MP3 à 320 kbit/s.
Les boîtes bleues mon­tre les capac­ités den­reg­istrement sans com­pres­sion À gauche trois for­mats le 78 tours le 33 tours et le MP3 à 320 kbits

En haut à droite, le for­mat CD (44,1 kHz/16 bits). En dessous, le for­mat DVD et les for­mats Haute réso­lu­tion. Ces deux derniers for­mats per­me­t­tent d’enregistrer des gammes de fréquences bien au-delà du néces­saire et des dif­férences de niveaux sonores supérieures à ceux qui pour­raient se ren­con­tr­er sur terre. Ce sont donc des for­mats des­tinés à l’enregistrement pro­fes­sion­nel. Par exem­ple, si le vol­ume d’enregistrement a été trop faible, on pour­ra l’augmenter sans rajouter de bruit de fond, ce qui serait impos­si­ble avec un for­mat CD ou DVD.
On restera donc prob­a­ble­ment à des valeurs raisonnables pour ce qui est de la dif­fu­sion de la musique en con­ser­vant les valeurs du CD ou du DVD.
Pour vous enlever toute hési­ta­tion, je vous présente ce qu’occupent les for­mats tra­di­tion­nels (LP 33 tours et shel­lac 78 tours) en com­para­i­son de la boîte du CD.

Les trois contenants au format 44,1 kHz et 16 bits) et comment s'y logent trois formats. Le 78 tours, le 33 tours et le MP3 à sa plus haute qualité.
Les trois con­tenants au for­mat 441 kHz et 16 bits et com­ment sy logent trois for­mats Le 78 tours le 33 tours et le MP3 à sa plus haute qual­ité

Je com­mencerai par le cas du MP3. La par­tie cen­trale est la taille du fichi­er. La par­tie qui l’entoure, en rose, c’est l’espace que va retrou­ver la musique après la décom­pres­sion. En théorie, on retrou­ve dans la musique décom­pressée, la même gamme de fréquences et la même dynamique que le CD. La dif­férence que l’on peut éventuelle­ment not­er dans de bonnes con­di­tions vient des arte­facts de com­pres­sion qui ont resti­tué des détails un peu dif­férents de ceux d’origine.
Dans les deux boîtes supérieures, j’ai placé le 78 tours et le 33 tours. On voit qu’il y a beau­coup de marge de manœu­vre. Les capac­ités du CD sont net­te­ment supérieures à celles de ces deux sup­ports.
Cer­tains pour­raient affirmer que le ren­du analogique est plus doux, meilleur ou je ne sais quoi, mais il s’agit plus d’un fan­tasme, notam­ment pour la musique his­torique du tan­go, qui n’a pas béné­fi­cié des tout derniers pro­grès du disque noir.
Le test est facile à faire. Placez un « mélo­mane » en écoute aveu­gle et deman­dez-lui s’il écoute la ver­sion CD ou la ver­sion shel­lac. Bien sûr, vous lui aurez offert le meilleur casque, ou une chaîne hi-fi haut de gamme pour être beau joueur.
S’il trou­ve à chaque fois sans se tromper, renou­velez le test dans une milon­ga avec une bonne sono. Si ce phénomène con­tin­ue de tou­jours dif­férenci­er le disque noir de sa copie numérique en qual­ité CD, c’est assuré­ment que votre trans­fert est de très mau­vaise qual­ité.
Dans ce cas j’ai un arti­cle pour vous aider, et éventuelle­ment un autre sur le net­toy­age des dis­ques

Vous aurez sans doute reconnu dans la photo de couverture, une évocation du merveilleux film de Fritz Lang, Metropolis. Mais peut-être ne savez-vous pas que, si on peut voir aujourd'hui ce film en entier, c'est grâce à l'Argentine qui avait conservé une version complète (au format 16 mm) contenant les 25 minutes que l’on croyait perdues. Aujourd'hui, on peut voir ce chef-d'œuvre absolu du cinéma en entier.
Vous aurez sans doute recon­nu dans la pho­to de cou­ver­ture une évo­ca­tion du mer­veilleux film de Fritz Lang Metrop­o­lis Mais peut être ne savez vous pas que si on peut voir aujour­dhui ce film en entier cest grâce à lAr­gen­tine qui avait con­servé une ver­sion com­plète au for­mat 16 mm con­tenant les 25 min­utes que lon croy­ait per­dues Aujour­dhui on peut voir ce chef dœu­vre absolu du ciné­ma en entier

2 réflexions sur « Informations sur la musique numérique »

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.