Ce que le taux d’échantillonnage dit sur la musique numérique et la qualité du son
À première vue, le taux d’échantillonnage n’est qu’une indication technique de l’audio. Toutefois, si vous comprenez son fonctionnement, votre perception de ce qu’est en réalité la musique numérique changera.
Un article sur le taux d’échantillonnage a l’air ennuyeux. De prime abord, il ne s’agit de rien d’autre que d’une indication technique. Cependant, lorsqu’il s’agit de savoir comment le taux d’échantillonnage affecte la qualité du son, j’ai constaté, chez moi comme chez d’autres, un certain nombre de demi-vérités et de malentendus. Une idée fausse sur la nature de la musique numérique y est également liée : la musique numérique serait composée de petites séquences et cela s’entendrait.
Les bases
Qu’est-ce que le taux d’échantillonnage au fond ? Regardons de plus près une représentation graphique d’une onde sonore. L’axe horizontal x correspond au temps et l’axe vertical y, à l’amplitude, c’est-à-dire au volume du signal. La tonalité, elle, est reproduite par la longueur d’onde : pour un son aigu, les intervalles sont plus rapprochés. Autrement dit, en cas de son aigu, la vibration se répétera plus souvent, donc la fréquence sera plus haute.
Le taux d’échantillonnage est aussi donné comme une fréquence, car elle définit justement la fréquence à laquelle l’amplitude est mesurée sur l’axe x ou, en d’autres termes, avec laquelle on prend un échantillon audio. En anglais, le taux d’échantillonnage se dit « sample rate ».
Le taux d’échantillonnage constitue l’élément qui distingue le plus clairement la musique analogique de la musique numérique. En effet, les supports analogiques possèdent un signal continu et n’ont donc pas de taux d’échantillonnage. Les méthodes d’enregistrement numérique enregistrent à des intervalles de temps déterminés.
Le malentendu
Tout cela donne l’impression que la musique analogique est supérieure à la musique numérique, comme si cette dernière n’était qu’une approximation de l’original analogique et ne pourrait jamais être aussi bonne. Toutefois, ce n’est pas le cas.
Ici nous ne comparons pas simplement l’analogique et le numérique, mais aussi le son original et l’enregistrement. Bien entendu, aucun son ne sera meilleur que l’original et tout enregistrement sera au mieux aussi bien que l’original. Cela dit, c’est aussi le cas d’un enregistrement analogique, car, ici aussi, il peut y avoir une perte de qualité avec des grésillements et des distorsions. En principe, seule la transmission sonore directe sans support sera de qualité supérieure, par exemple entendre directement le son d’un instrument.
Le malentendu est probablement dû au fait que les ondes sonores sont analogiques. La musique numérique n’existe à proprement parler pas. Il s’agit en fait d’une musique enregistrée de manière numérique. Lors de l’enregistrement, un convertisseur analogique-numérique est nécessaire pour créer des données numériques à partir d’ondes sonores analogiques. Pour lire ensuite ses données, il faut un convertisseur analogique-numérique qui fait exactement le contraire.
Le signal sonore doit toujours être transformé, même dans le cas d’un enregistrement analogique, et lors de la lecture, le son doit être reproduit à partir de l’enregistrement. Un haut-parleur convertit un signal électrique en un mouvement mécanique.
Dès la fin des années 70, les studios d’enregistrement ont commencé à utiliser l’enregistrement numérique. Cela signifie que même dans le cas d’un vinyle, le son analogique est converti en son numérique avant d’être reconverti en son analogique.
Il existe cependant encore une autre idée fausse plus fréquente sur la musique numérique qui a aussi à voir avec le taux d’échantillonnage.
Numérique ne veut pas dire en escalier
La mesure en intervalles réguliers marque donc des points isolés dans le diagramme à partir desquels une véritable courbe acoustique doit être créée lors de la lecture. Les fans de l’analogique pensent à tort que la courbe acoustique ressemble à ça :
Ou même à ça :
Mais ce n’est pas du tout le cas. La courbe produite à partir des données numériques ressemble plutôt à ça. Une courbe acoustique produite à partir de données numériques est tout aussi arrondie qu’une courbe analogique.
En d’autres termes, les données numériques individuelles fragmentées sont reconverties en véritables ondes sonores complètes. Est-ce de la magie ? Non, plutôt des mathématiques. Les courbes sont des fonctions mathématiques qui nécessitent une quantité minimale de points de mesure, c'est-à-dire un taux d’échantillonnage minimal. C’est ici que le théorème de Nyquist-Shannon entre en jeu.
Le théorème de Nyquist-Shannon
Ce théorème montre que lors d’un taux d’échantillonnage suffisamment élevé, une courbe acoustique identique à l’original analogique peut être reconstruite. De plus, ce théorème définit la hauteur que le taux d’échantillonnage doit avoir : le double de la fréquence la plus élevée qui doit être échantillonnée.
L’exemple le plus connu est le suivant : le CD audio a un taux d’échantillonnage de 44 100 Hz, c’est-à-dire 44,1 kHz. Cela signifie qu’il y a 44 100 échantillons par seconde. Selon le théorème de Nyquist, cela permet de reconstruire parfaitement des fréquences jusqu’à 22 050 Hz. Cela suffirait amplement, car aucun être humain n’est en mesure d’entendre de plus hautes fréquences. En effet, la plupart des adultes n’entendent plus au-dessus de 15 000 Hz.
Le théorème s’applique cependant que si toutes les fréquences au-dessus de 22 050 Hz sont filtrées. Vous le voyez dans le graphique suivant. Les points noirs représentent les échantillons. Trois courbes de différentes fréquences relient ces échantillons. Vu que toutes les trois courbes passent par les échantillons, on ne sait pas dès le départ quelle est la fréquence correcte.
Cela dit, les courbes bleue et verte ont une plus haute fréquence que la rouge. Dans notre exemple, la courbe rouge est exactement de moitié aussi élevée que le taux d’échantillonnage. Si nous filtrons tout ce qui est au-dessus, les deux autres courbes disparaissent et cela devient clair.
Il ne s’agit pas d’un hasard. En reliant ces points, il n’est pas possible de tracer une courbe dont la fréquence est plus basse que celle de la courbe rouge. C’est exactement ce que montre le théorème de Nyquist-Shannon.
Le suréchantillonnage
Le théorème de Nyquist est considéré comme indiscutable. Malgré tout, il existe des convertisseurs numérique-analogique dont le taux d’échantillonnage est plusieurs fois supérieur à celui des CD. Est-ce inutile ? Serait-ce même un attrape-nigaud ?
Pas forcément. Le fait est que le théorème de Nyquist dit seulement que les hautes fréquences doivent être filtrées, mais pas de quelle manière. En effet, jusqu’à aujourd’hui, il n’est pas possible de tout filtrer parfaitement à partir d’une fréquence donnée.
À un taux d’échantillonnage de 44,1 kHz, un filtre passe-bas qui ne filtre rien jusqu’à 20 kHz et tout à partir de 22,05 kHz est nécessaire. Ainsi, il n’y a qu’une petite gamme de fréquences comme transition. Si le signal n’est pas filtré parfaitement, il peut arriver que l’onde sonore soit reflétée à gauche et qu’une sorte de pré-écho se produise.
Avec un taux d’échantillonnage élevé, cette zone de transition augmente et cet effet est plus facile à éviter. Dans les studios d’enregistrement, les taux d’échantillonnage élevés sont monnaie courante depuis longtemps. Cela est toutefois relativement nouveau pour ce qui est de la lecture.
Bilan
Le fait que la musique numérique soit constituée à partir d’échantillons au lieu d’un enregistrement continu n’est pas un inconvénient. À partir des échantillons, il est possible de reconstruire des ondes sonores guère différentes de l’original. En théorie, il suffit d’un taux d’échantillonnage deux fois plus élevé que la plus haute fréquence. En pratique, la reconstruction ne sera pas parfaite, car il n’existe pas de filtre passe-bas parfait. Avec un taux d’échantillonnage plus élevé, les appareils d’enregistrement et de lecture peuvent encore mieux filtrer.
La question qui se pose est celle de savoir si ces améliorations sont vraiment utiles, c’est-à-dire si la différence s’entend vraiment. Même les experts ne sont pas unanimes sur le sujet. Ce qui est sûr, c’est que des sons à des fréquences de 44,1 kHz et 48 kHz seront de bonne qualité. Un mauvais son peut avoir différentes causes pouvant aller de l’enregistrement aux haut-parleurs. Dans ce contexte, le taux d’échantillonnage peut seulement poser problème si tout le reste est irréprochable.
Mon intéret pour l'informatique et l'écriture m'a mené relativement tôt (2000) au journalisme technique. Comment utiliser la technologie sans se faire soi-même utiliser m'intéresse. Dans mon temps libre, j'aime faire de la musique où je compense mon talent moyen avec une passion immense.