Rechercher
  • Académie du Gros Son

Fréquence d'échantillonnage et profondeur de bit. C'est quoi et que choisir.

Maintenant que vos amis de l’Académie Du Gros Son vous ont aidé à trouver votre carte son et votre programme pour enregistrer votre chef d’œuvre, il est temps de créer votre première session. Première chose que votre programme va vous demander : "Dans quelle fréquence d’échantillonnage voulez-vous travailler ? " Et là vous dites : pardon ??? Pas de panique, c’est très simple !


Votre programme travail sur un son numérique. C’est à dire du son, mais sous forme de données informatiques. Vu que le son arrive à l’entrée de votre nouvelle carte son en analogique (sous forme de courant électrique), cette dernière va s’occuper de convertir cette variation de tension électrique en données informatique. Là vous vous dites "OK, mais ça c’est son taf, en quoi ça me concerne ?" Ne vous offusquez point, la pauvre carte son essaye juste de vous donner le contrôle ! Elle peut faire son travail avec une définition (niveau de détail) variable et là c’est vous qui décidez.


Du son en analogique peut se visualiser sous ce que l’on appelle une forme d’onde.

Comme ceci :


Sans rentrer dans le côté technique ou scientifique, on va dire que c’est à ça que ressemble notre son. Pour que notre ordinateur voit aussi cette onde, on va lui découper en petit morceau et lui dire, à chaque morceau, où en est notre son en terme d’intensité (de volume sonore). Pour le dire autrement, tous les "X temps", disons chaque seconde, le son va fort comme "ça".


On se retrouve avec deux infos. Dans un sens le temps et de l’autre l’intensité. Le nombre de mesures prises dans le temps est ce qu’on appelle la fréquence d’échantillonnage. L’autre mesure, celle de l’intensité, est la profondeur de bits (désolé, c’est le vrai terme, je ne l’ai pas inventé).


Fréquence d’échantillonnage :

Maintenant si on coupe toutes les secondes pour voir où en est le son, ça ne sera pas du tout fidèle et on va rater pleins d’infos entre chaque seconde. Dans le schéma ci-dessous, la courbe rouge qui résulte de mon échantillonnage de une fois par seconde, ne ressemble pas du tout à mon onde de départ.


On va donc faire beaucoup plus de découpes. Au minimum 44100 découpes par seconde. Pourquoi ce chiffre ? Sans rentrer dans trop de détails, une oreille humaine en bon état entend des fréquences de 20 Hz à 20.000Hz. Donc entre 20 et 20.000 battements par secondes, 20Hz étant un son très, très grave (une basse qui ressemble plus à un tremblement de terre qu'à une note) et 20.000Hz (ou 20kHz) un son très, très haut, tellement aigu qu'il n'est réellement perceptible que pas des petits enfants et des "oreilles d'or". Pourquoi alors découper notre son au moins 44100 fois par seconde si on entend pas jusque là (40kHz) ? C’est juste pour éviter les soucis de fréquence de repli venant de la fréquence de Nyquist lors de la conversion. Pour les geeks, vous passez sur votre moteur de recherche favoris si vous voulez les détails. Les autres vous retenez que pour arriver à la fréquence d'échantillonnage voulue, il faut multiplier la fréquence maximum qu'on veut pouvoir décrire/entendre en numérique par deux, sinon le programme va "voir" des fréquences qui n’existent pas dans le son d'origine. Oui, c'est assez complexe sous tout ce code et ces boutons !


Donc maintenant on sait qu’il faut au moins 44100 découpes par seconde pour décrire à peu près correctement ce qu'un humain peut entendre en théorie. Ce qui correspond à 44.1 KHz (K pour 1000 et Hz pour battement par seconde). C’est le format utilisé par un CD par exemple. Si on le veut, nos programmes nous laissent le choix d’avoir encore plus de précision et donc plus de définition. Vous trouverez 44.1Khz, 48 KHz, 88.2 KHz ou 96 KHz (il existe encore plus, mais on est en 2020 niveau technologique, on va y aller mollo :)). Bien-sûr, plus vous montez et plus les fichiers sont lourds et plus il faut une machine performante pour jongler avec ça. 96 KHz c’est cool mais plutôt un standard pro pour des applications de haute fidélité, comme l'enregistrement de musique classique. 44.1 KHz ou 48 KHz ça marche aussi très bien et c'est exactement la définition choisie pour 99.99% de musique que vous écoutez.


Profondeurs de bits :

OK pour la fréquence d’échantillonnage. Maintenant au moment de chaque découpe on doit dire à l’ordinateur à quelle intensité (ou volume sonore) est notre son. On va donc diviser également cette échelle de mesure avec un certain nombre d’échelons. L’intensité d’un son se mesure en dB (= décibels). L’oreille humaine peut nous servir de référence pour avoir un ordre de grandeur. 0 dB on entend rien du tout, 120 dB c’est le seuil de la douleur (l’intensité sonore est trop forte à soutenir), 40 dB représente un appartement calme et 60 dB la fenêtre ouverte sur la rue. Dans le son on parle de dynamique, c’est la différence entre l’intensité la moins forte et la plus forte. La dynamique de l’oreille est donc de 120 dB.


Dans le monde informatique, les données sont codées en bit, c'est-à-dire un "mot" informatique (les geeks qui sont partis étudier le théorème de Nyquist sont de retour et se régalent). 1 bit nous donne une plage de dynamique de 6 db. Le standard du CD est en 16 bit. Donc 16X6= 96 dB. C’est déjà une belle dynamique. On pourrait se dire que c’est moins que l’oreille sauf que le 0 dB (silence absolu) n’existe pas dans notre quotidien. Les morceaux de musique qui ont la plus grande dynamique sont dans le domaine de la musique classique, 80 dB étant déjà très extrême. La musique moderne n'a parfois que quelques dB de dynamique. Notre programme va souvent proposer 16 bit, 24 bit et 32 bit float. Comme règle simple : 16 c’est OK, mais 24 est mieux et en général, il n'y a pas beaucoup de raisons de ne pas l'utiliser. Il nous reste 32 qui pour l'instant reste un standard plus pro et demande des machines plus puissantes, due à la quantité d'informations présentes avec autant de définition. Avec 24 et donc 144 dB de plage dynamique ça vous laisse un espace très confortable pour travailler. On utilise souvent la phrase "plus de headroom" (headroom = espace disponible). C'est un peu comme faire du trampoline dans une pièce ou le plafond est plus haut que la hauteur ou vous montez et vous laisse donc plus de place pour éviter les maux de tête :). Vous pouvez triturer le son, le booster et éviter de ramener du bruit de fond par exemple. L'espace de travail est plus grand.


Voilà, vous savez tout ou presque. Maintenant allez faire de la musique !

158 vues0 commentaire
  • Icône Facebook blanc
  • Icône Instagram blanc