Le son, une information à coder Cours

Sommaire

ILa numérisation d'un sonASignaux analogiques et numériquesBL'échantillonnageCLa quantificationDLes critères d'une numérisation fidèleIILa taille et la compression d'un fichier audioALa taille d'un fichier audioBLa compression d'un fichier audio numérique

Le son peut être enregistré sur un support informatique. Les techniques numériques ont mis en évidence un nouveau type de relations entre les sciences et les sons. 

Comment peut-on transformer le son en signal numérique ?

I

La numérisation d'un son

A

Signaux analogiques et numériques

Lorsqu'un son (vibration de l'air) est reçu par un capteur, un signal électrique, image de sa variation au cours du temps, est obtenu. Pour que ce signal analogique soit stocké et traité par un support informatique, il faut le convertir en signal numérique.

Signal analogique

Un signal analogique est un signal continu qui peut prendre une infinité de valeurs.

-

Signal numérique

Un signal numérique est un signal discontinu, composé d'une succession de valeurs discrètes.

-

Les signaux numériques sont moins sensibles aux perturbations et peuvent être reproduits et transmis plus facilement que les signaux analogiques.

La conversion d'un signal analogique en signal numérique présente deux étapes importantes : l'échantillonnage et la quantification.

B

L'échantillonnage

Contrairement à un signal analogique, un signal numérique ne peut contenir qu'un nombre restreint de valeurs. Le rôle de l'échantillonnage est de sélectionner les valeurs qui seront retenues pendant la conversion.

Échantillonnage

L'échantillonnage consiste à prélever successivement des valeurs du signal analogique, appelées échantillons, à intervalles de temps réguliers Te. Te est appelée période d'échantillonnage.

Entre deux périodes d'échantillonnage, la valeur du signal numérique est maintenue (bloquée) et ne peut pas varier, d'où l'aspect caractéristique en marches d'escalier.

-
C

La quantification

Une fois le son reçu par un capteur, les valeurs du signal analogique sont généralement des tensions, exprimées en volts (V). Les supports informatiques sont capables de traiter seulement des nombres binaires, composés de  « bits » qui peuvent valoir 0 ou 1. 

Quantification

La quantification consiste à associer à chaque échantillon un nombre binaire composé de n bits correspondant à sa valeur.

-

Le nombre de valeurs possibles dépend du nombre de bits utilisés par le convertisseur. 

Résolution R

La résolution R correspond à la quantité de nombres binaires que l'on peut obtenir à partir de n bits. Elle est donnée par la relation suivante :

R = 2^n

Avec un convertisseur de résolution 3 bits, les nombres binaires sont composés de 3 chiffres 0 ou 1, ce qui donne 2^3 = 8 valeurs possibles :

Nombre binaire

000

001

010

011

100

101

110

111

Nombre décimal correspondant

0

1

2

3

4

5

6

7

Les signaux contenus sur les CD audio sont quantifiés à l'aide de 16 bits. Ils sont donc quantifiés sur 65 536 valeurs : R=2^n = 2^{16} = \text{65 536}.

D

Les critères d'une numérisation fidèle

La fidélité d'une numérisation est le terme utilisé pour discuter de la ressemblance entre le signal analogique initial et le signal numérique obtenu.

La fidélité de la numérisation dépend de :

  • La fréquence d'échantillonnage Fe : plus elle est importante, plus la durée des échantillons est faible et plus le signal numérique se rapproche du signal analogique.
  • La résolution  R  : plus elle est importante, plus la quantification est fine car le nombre de valeurs possibles est plus grand et plus le signal numérique se rapproche du signal analogique.
-
-

Théorème de Shannon

Pour que la numérisation soit satisfaisante, il faut que la fréquence d'échantillonnage Fe soit au moins le double de la fréquence du son à numériser.

-
  • Si le rapport  \dfrac{F_e}{F_{\text{signal}}} \lt 2 : l'allure et la période du signal numérique ne correspondent pas à celui du signal analogique, des défauts dans le son enregistré seront audibles.
  • Si le rapport \dfrac{F_e}{F_{\text{signal}}} = 2 : la période du signal numérique correspond bien à celui du signal analogique, mais pas son allure, il vaut mieux que le rapport soit plus grand.
  • Si le rapport \dfrac{F_e}{F_{\text{signal}}} \gt 2 : l'allure du signal numérique se rapproche à celui du signal analogique, le son enregistré est de meilleure qualité.

Sur les CD audio, les fichiers sont numérisés avec une fréquence d'échantillonnage de 44,1 kHz. Celle-ci permet une numérisation fidèle car elle est supérieure au double de la fréquence maximale audible F_{\text{max}} = 20\text{ kHz}.

II

La taille et la compression d'un fichier audio

A

La taille d'un fichier audio

Les grandeurs caractéristiques d'une numérisation (fréquence d'échantillonnage, résolution) permettent de déterminer la taille d'un fichier audio.

Taille d'un fichier audio

La taille d'un fichier audio numérique est donnée par la formule suivante :

\text{Taille (en bits)} =F_{e} \times n \times \Delta t \times N

Avec :

  • F_{e} , la fréquence d'échantillonnage exprimée en hertz ;
  • n, le nombre de bits utilisés pour la quantification ;
  • \Delta t , la durée du fichier audio exprimée en secondes (s) ;
  • N, le nombre de canaux : 1 pour un fichier mono, 2 pour un fichier stéréo, 6 pour un fichier 5.1.

La taille d'un fichier de  2,00 \times 10^7  bits est :

\dfrac{2,00 \times 10^7 }{8} = 2,50 \times 10^6\text{ octets }

Soit :

\dfrac{2,50 \times 10^6 }{8} = 2,38\text{ Mio}   

Traditionnellement, en informatique, les tailles des fichiers sont exprimées en octets. Un octet est un groupe de 8 bits. Les multiples des octets ne correspondent pas à des puissances de 10 mais à des puissances de 2.

Ainsi, pour les conversions : 

  • 1 octet = 8 bits ;
  • 1 kibloctet (Kio) = 210 octets ;
  • 1 mébioctet (Mio) = 220 octets.

La formule de la taille d'un fichier audio peut également s'écrire : 

\text{Taille (en bits)} =D \times \Delta t

Avec :

  • D , le débit binaire du fichier audio, qui correspond à D = N\times n\times F_e ;
  • \Delta t , la durée du fichier audio exprimée en secondes (s).
B

La compression d'un fichier audio numérique

Afin de diminuer la taille d'un fichier audio numérique sur un support informatique, on le compresse.

Taux de compression

Le taux de compression T est le rapport de la taille du fichier après compression sur sa taille avant compression :


T = \dfrac{\text{Taille fichier compressé}}{\text{Taille fichier non compressé}}

Lorsqu'un utilisateur compresse un fichier audio numérique avec le format MP3 à 128kbits/s dont le taux de compression est \dfrac{1}{12}, il divise par 12 la taille du fichier initial.

Compression

La compression consiste à diminuer la taille d'un fichier afin de faciliter son stockage et sa transmission. 

Le format MP3, très répandu, est un format de compression des fichiers audio.

Les données perdues lors de la compression se traduisent par une  « perte d'informations ».

Les techniques de compression spécifiques au son, dites avec perte d'information, éliminent les informations sonores auxquelles l'oreille est peu sensible.

Le format MP3 à 320 kbits/s, dont le taux de compression est 1/5, génère des fichiers plus lourds que le format MP3 à 128 kbits/s mais qui sont plus fidèles au fichier initial.

Si dans un extrait musical, deux sons de fréquences voisines sont présents mais que l'amplitude de l'un est plus faible que l'autre, il ne sera pas perçu par le système auditif (effet de masquage). Il peut donc être « éliminé » du fichier, ce qui diminue sa taille.