Le
son numérique est devenu la norme, mais il est encore décrié par de
nombreux puristes audiophile, et peut être pas toujours à tort.
Un peu d'histoire
Au début les choix
techniques audacieux des pères du CD (Philips et Sony) étaient tout
simplement imposés par les limites de la technologie de l'époque.
Personne ne savait encore fabriquer un convertisseur 16 Bit de haute
précision travaillant à 44,1 kHz. L'optique laser et son asservissement
était un autre défi à relever et même la méthode de pressage des CD
était encore quasi expérimentale (plus de 50% de déchet la première
année !).
Le but était de dépasser le disque vinyle en qualité et en fiabilité,
le tout sous un format agréable à manipuler. (La légende dit que la
taille du trou central a été agrandie pour permettre à la femme du
président du groupe Sony de le manipuler plus facilement avec ses
petites mains en glissant un doigt dans l'ouverture !). La suite est
connue de tous, la mise en commun des technique laser-disc de Philips
du code de correction d'erreur du DAT Sony finiront par produire le
fameux CD, avec 74 min de musique au format de 16 Bits et 44 100
échantillons par seconde le tout sur une galette de 12 Cm (la durée de
74 minutes a été imposée par Herbert Von Karajan pour pouvoir
enregistrer la Symphonie N 9 de Beethoven sans coupure).

Karajan, Sinjou
et Morita, les pères du CD
Comment ça marche ?
Le principe est relativement simple, c’est une sorte de voltmètre
numérique très rapide, le signal analogique est mesuré 44100 fois par
seconde, la précision de la mesure est sur 16 bits ce qui correspond à
65536 niveaux. Pour finir les valeurs numériques sont enregistrées dans
un format adapte au support (bande magnétique ou
disque optique).
Lors de la lecture, il suffit de produire à la même fréquence une
succession de tensions continues. Il est évident que le signal
reproduit est la copie du signal source à un détail près les « marches
d’escalier » que l’on essaie de lisser ensuite pour obtenir à nouveau
un signal analogique propre. La différence entre le signal original et le
signal en « marches d’escalier » est appelée bruit d’échantillonnage.

Les problèmes commencent
La
bande passante d’un système échantillonné à 44,1 kHz est en théorique
de 0.5 fois cette fréquence, mais dans la pratique deux échantillons ne
permettent pas la reproduction d'un signal ayant à la fois la bonne
phase, la fréquence exacte et la bonne amplitude (problème de battement
entre la fréquence d’échantillonnage la fréquence mesurée). La
conversion d'un sinus devient à peu près correcte à partir de trois
échantillons par période, en partant du principe que le filtre de
lissage est parfait et que le signal reste inchangé pendant plusieurs
périodes ce qui est rarement le cas avec la musique ! En clair, de 0 à 10 kHz le signal est de bonne qualité,
au-dessus la qualité baisse rapidement et après 14,7 kHz le signal
devient une approximation grossière du signal d’origine.
Heureusement un petit génie (de chez Philips) avait imaginé une théorie
mathématique pour des filtres numériques environs deux ans avant la
sortie du premier lecteur de CD. La technique de sur-échantillonnage en
découle directement. Vous vous souvenez des convertisseurs 14 Bit 176.4
kHz de Philips, les maths démontrent qu'il s'agit en fait exactement de
la même information présentée sous une autre forme.
Le dessin ci-dessous explique le principe de cette technique (chaque case représentant une variation de 1 bit)
En passant de 16 à 14 bits, les sauts du signal décodé sont 4 fois plus
grands, mais en multipliant la fréquence d'échantillonnage par 4 les
sauts deviennent 4 fois plus nombreux. Vous constatez que la zone grise
des deux versions du signal sont identiques, et que les cases colorées
ont juste changées d'orientation. Nous avons donc exactement le
même nombre de cases reproduisant exactement le même signal !
Philips possédait déjà pour ces pour les appareils de mesure une puce
de haute précision capable de travailler à plus 176 kHz et fabriquée en
grande série à un prix raisonnable...
Cette méthode de sur-échantillonnage permet de simplifier le dramatique
problème de filtrage. Sur le graphique ci-dessus la mise en forme du
bruit d’échantillonnage est obtenue par la disposition particulière des
espaces entre les cases colorées. Cet artifice permet de repousser le
bruit d'échantillonnage vers les fréquences les plus élevées possible
de façon à le rendre inaudible.
Le graphique ci-dessous montre la répartition spectrale d'un son
échantillonné et reconstitué normalement puis le même son avec un
sur-échantillonne x 4.

|
Il
est tout de suite évident que dans le premier cas il est impossible de
créer un filtre qui laisse tout passer à 20 kHz tout en supprimant
toutes les fréquences indésirables au-dessus de 24 kHz.
En multipliant la fréquence d'échantillonnage par 4 ou plus, le spectre
de ces fréquences indésirables est décalé proportionnellement vers le
haut et devient donc beaucoup plus facile à supprimer en utilisant un
filtre analogique plus simple qui ne perturbera pas le signal utile.
La firme DECA a aussi imaginé des techniques inverses au
sur-échantillonnage pour les appareils d'enregistrement tout au début
de l'ère Digitale (un peu avant la commercialisation du CD). En
mesurant le signal a la fréquence de 88,2 kHz et en faisant la moyenne
de 2 mesures leur signal 44,1 kHz une fois décodé avait une qualité
audio nettement supérieure
Depuis les techniciens ont poussé le bouchon de plus en plus loin !
Très vite l’arrivé de convertisseurs à 16 ou 18 bits plus rapides a
permis d’imaginer des méthodes de calcul qui utilisent à la fois le
sur-échantillonnage et l'utilisation des bits supplémentaires pour une
mise en forme du bruit d’échantillonnage plus sophistiquée avant le
lissage du signal. En théorie on peut alors espérer atteindre 20 kHz
avec une bonne qualité, mais ce qui se passe au-dessus de 10kHz dépend
autant des méthodes de calcul du signal numérique que du signal
analogique d’origine. Une grande partie des différences de qualité
sonores entre les lecteurs de CD réside donc dans cette conversion
mathématique et dans la qualité de l'ampli tampon analogique qui suit.
Mais la difficulté majeure a longtemps été la maîtrise de la linéarité
des convertisseurs avec 16 bits, le bit de poids faible représente une
variation du signal sonore 65536 plus petite que le bit de poids fort.
Une précision d’au moins 1/100 000 est donc à peine suffisante pour la
fabrication du bit de poids fort !
Quel sont les avantages ?
Le dessin ci-dessous essaie
de visualiser ce qui se passe entre l’enregistrement du signal «
musical » et sa reproduction a votre domicile en analogique ou en numérique (avec les techniques
modernes de sur échantillonnage et de mise en forme du bruit pour la
partie numérique). A priori les deux systèmes détériorent le signal en
le rendent en quelque sorte « flouté ».
Mais dans le
monde réel, entre la prise de son du concert et sa reproduction à votre
domicile il y a beaucoup plus que 2 ou 3 étapes, et le signal analogique devient
à chaque nouvelle manipulation de plus en plus flou !
Par
contre le signal numérique peut être copié, retransmis et même
recalculé un grand nombre de fois sans subir la moindre perte d'information. Il
suffit de faire tous les calculs avec une précision supérieure à celle
du support final et le son peut subir des manipulations mathématiques
sophistiquées sans détérioration de qualité. Des systèmes de contrôle
et de correction des erreurs permettent en plus de transporter, copier
ou stoker les fichiers numériques sans ajouter des altérations.
Les seules étapes décisives qui déterminent la qualité du signal sont
l’encodage de l’analogique vers le numérique et le décodage en sens
inverse.
Pourquoi arrêter le progrès ?
On
arrive en quelques années à des convertisseurs D/A et A/D basés sur la
technique du "ONE Bit" avec différentes appellations. Le codage est
fait sur un seul bit mais la fréquence d'échantillonnage est de 2,82
MHz ou plus !
Pour l'enregistrement Sony a mis au point le DSD qui présente la
possibilité de produire par un simple calcul (le Super Bit Mapping) la
quasi-totalité des formats audio existants !
A la lecture, l’opération mathématique inverse est possible, les
données du flux d'information sont transformées sans perte d’informations en un flux à très haute
fréquence codé sur un seul et unique bit. Le convertisseur A/N est
alors réduit à une résistance et un condensateur ! L
a qualité de la
conversion dépend ici uniquement de la méthode de calcul et de la précision de
l'oscillateur à quartz du système (on dépasse au 1/10 000 000 sans aucune
difficulté).
Le schéma ci-dessus en indique les possibilités du système DSD
Cette technique
ultra performante de convertisseur A/N One Bit était initialement destinée aux
lecteurs de CD bon marchés à cause du prix ridicule des composants nécessaires. Hélas,
même si elle a conquis ses lettres de noblesses et équipé certains appareils
prestigieux elle ne s’est pas imposée sur le marché.
SACD ou DVD Audio ?
Une fois de plus Sony et son acolyte Philips vont essayer de tirer
la couverture à eux avec le SACD, l'argument commercial
était la
compatibilité avec le CD, ces nouvelles galettes conçues comme un DVD
contiennent deux couches, l'une d'elle étant 100% compatible aux normes
CD, l'autre contient le fameux son haute définition SACD en stéréo ou
en 5.1. Cette seconde couche ne pourra être lue que par les nouveaux
appareils.
L'argument technique est bien plus intéressant, le SACD vous propose la
qualité studio d'enregistrement à domicile, je m'explique le standard
du SACD est tout simplement une nouvelle mouture du DSD utilisé en
studio, et Sony vous propose de l'enregistrer tel quel sur un DVD sans
faire les conversions de formats successives.
Le schéma suivant vous
donne une idée de la simplification progressive de la chaîne de
reproduction digitale. Le SACD est un système très performant qui ne
nécessite même pas une technologie d'avant-garde dans votre lecteur de
disque.
Les défenseurs du
DVD Audio avancent comme argument que la norme DSD est déjà ancienne et n'était
initialement pas prévue pour être enregistrée sur un DVD. Ils pensent que dans
l'état actuel de la technologie, on peut théoriquement faire beaucoup mieux,
par exemple avec un codage sur 24 Bits à 192 kHz, en principe cette norme
d'enregistrement contient plus d'informations que le SDS et devrait donc être
plus performante, mais encore une fois, on dépasse de très loin dans les deux
cas les limites de l’audition humaine
Ma préférence va
au SACD (vous l'avez certainement remarqué, non ?) parce que ce système,
techniquement simple, permet de dépasser sur tous les plans les
performances de nos oreilles et cela sur tous les canaux d'un enregistrement
5.1. Mais l’histoire et les consommateurs ont fait des choix différents des
miens, le SACD a été un demis succès, le DVD audio n’a jamais vraiment démarré,
c’est la musique dématérialisée qui a pris le dessus malgré une qualité audio le
plus souvent inférieure à celle du bon vieux CD.