MPEG Audio

 


Pour commencer je dois corriger une erreur devenue tellement courante que plus personne n’y prête attention. Le MP3 n’existe pas ! En effet ce que l’on appelle MP3 par abus de langage est en réalité du MPEG1 layer 3 ou du MPEG2 layer 3. C’est donc bien le même standard d’encodage multimédia que pour les vidéos, mais sans la partie image (c’est ce que signifie « Layer 3 »)

Ceci étant dit, je peux aborder le principe de base d’un codage audio dit destructif (comme le MPEG) est tout simple : Pourquoi enregistrer et chercher à reproduire des sons que l’on ne peut pas entendre ?

La première étape du codage MPEG consiste à découper le message sonore en petites séquence d'environ 25 ms, en partant du principe que l’oreille humaine à un temps de réaction suffisamment important pour ne pas détecter de variations qualitative ou quantitative du son pendant en temps aussi court. Des pertes de précision  et de dynamique sont possibles si les échantillons sont plus longs.

La seconde étape à utiliser les transformations de Fourrier pour décrire le son non pas comme un signal continu complexe qui fluctue pendant la durée d’une de ces séquences, mais comme une série de fréquences pures dont la puissance instantanée de chacune a une valeur  précise (et constante) pendant chaque séquence (pas de perte d’information)


Onde%20complexe%201.jpg

Pour finir on limite la bande passante en supprimant les sons trop graves ou trop aigus, .en fonction de l’usage prévu pour le MP3. Les pertes deviennent audibles si les limites son mal choisies, il faut utiliser les limites du système de codage, soit de 0Hz à 19.5 kHz pour une fréquence d’échantillonnage de 44.1 kHz (CD audio)

L’encodeur vérifie ensuite pour chaque séquence quelles informations sont audibles par l’oreille humaine pour ne garder que celle-ci. Pour cela on utilise des modèles psycho-acoustiques standard qui décrivent les performances de l’oreille humaine. Les seuils de suppressions dépendent bien entendu du niveau de compression choisi, et les pertes sont forcément audibles si les seuils de suppression son trop élevés !


Sur le schéma ci-dessous nous les zones jaunes et grises délimitent ce qui ne sera jamais enregistré avec les réglages choisis, (la bande passante est limité de 30 Hz à  15 kHz ce qui est trop peu).

Les zones roses et bleu clair montrent ce que l’on appelle l’effet de masque fréquentiel, dans notre exemple, le son vert est trop proche du son rouge, et à cause de son niveau trop faible sera masqué par le son rouge, il ne sera donc pas enregistré.

psychoacoustique%201.jpg

Il existe aussi  un effet de masque temporel, un son faible de courte durée précédent ou suivant immédiatement un son nettement plus fort n’est pas non plus audible, ce phénomène est d’autant plus marqué que les deux sons utilisent des bandes de fréquences proches ou que la différence de niveau est importante.

 

masquage%20temporel.jpg


Pour améliorer encore le niveau de compression il n’est pas recommandé d’enregistre le MP3 avec un flux d’information à débit constant (CBR pour constant bit rate). En effet le signal sonore peut être à un moment très complexe et nécessiter une grande quantité d’informations pour être encodé avec une bonne qualité, et un instant plus tard être réduit quasiment a un son pur ou à un silence qui nécessite forcément beaucoup moins d’informations. En ajustant en permanence le débit numérique le procédé VBR (Variable Bit Rate) permet de réduit la taille du fichier sans réduire la qualité de la musique.

Jusque là tout semble clair, en théorie il suffit de choisir les bons réglages, et le procédé ne supprime que ce que l’on n’entend vraiment pas, mais c’est oublier que le format MPEG est une formidable boite à outil avec de très nombreux réglages. Vous pouvez au choix comprimer le son (et l’image) pour une visioconférence sur un réseau internet à bas débit avec une image au format timbre poste et une bande passante audio même pas digne d'un téléphone analogique, ou bien produire les images FullHD et un signal audio 5.1 d’une qualité identique au meilleur des CD.

La mauvaise réputation du format MP3 vient donc surtout des innombrables fichiers audio disponibles sur internet et presque toujours encodés par des personnes qui ignorent complètement comment régler leur programme d’encodage pour en obtenir une qualité optimale. Avec les réglages d’origine de leur programme il ne produisent que des fichiers optimisés pour avoir la plus petite taille possible avec une qualité audio acceptable. En exigeant le maximum de performance audio le même programme produirait des fichiers peut être 20% ou 30 % plus grand, mais qui conserverait la qualité sonore du CD d’origine.

Vous trouverez dans le chapitre "Mon système" sur la page "Programmes" de la rubrique PC Home-Cinéma une sélection de programmes gratuits permettant de créer des MP3 de la meilleure qualité possible avec les explications pour les réglages.

 

         


 Retour a l'acceuil