Internet et multicanal

Aujourd’hui mais pas pour demain... Rien de tel que l’été pour prendre le temps de remonter à Mathusalem et tacher de voir ce qui préoccupe tant d’acteurs de la production audio-visuelle depuis que les temps se sont mis à changer plus vite que la musique...

Au commencement était le Verbe

La différence entre pré-histoire et histoire tient en une chose bien précise : l’écriture. A partir du moment où des hommes ont mis par écrit les événements qui les marquaient, l’humanité accéda à l’histoire. Mais au début, l’écriture n’était pas composée de mots, au sens propre du terme, mais d’idéogrammes. C’est à dire qu’un signe tracé ne renvoyait pas à une parole mais à une image, une idée, un concept, propre à la culture et à la mentalité d’un endroit donné. Quelques temps passèrent et vinrent les Phéniciens, porteurs d’une idée révolutionnaire : ils inventèrent un système d’écriture, composé de vingt-deux lettres qui, en les assemblant, ne servaient plus à former des images mais des sons, des syllabes, qui assemblés à leur tour formaient des mots. Pour la première fois, un même système d’écriture pouvait être utilisé pour décrire un nombre infini de langages, au lieu d’être de fait réservé au peuple qui l’avait conçu. Ce fut, en quelque sorte, le premier standard majeur et presque international. Mais chaque revers ayant sa médaille, un effet - certes mineur et secondaire comparé à l’énorme progression que cela a entraîné - fut de séparer l’image du son. Peut-être est-ce cela aussi qui, à près de 2000 ans d’écart, sépare le rédacteur de la Genèse (que la lumière soit) de Saint Jean l’Evangéliste (Au commencement était le Verbe). Il est d’ailleurs frappant que cette distinction entre image et son soit demeurée aussi présente au fil des siècles comme en témoigne les options choisies par les religions sémites (Juifs et Musulmans), toujours fidèles au texte, et la Chrétienté plus orientée vers l’image par la représentation iconographique. Certes, ces considérations quasi-métaphysiques n’ont peut-être pas totalement leur place dans un magazine consacré aux techniques d’enregistrement et de reproduction sonore, et pourtant...

L’heure de la réconciliation

Depuis donc fort longtemps, les créateurs d’images furent séparés de leurs frères créateurs de sons. Le XXème siècle apporta une première forme de réconciliation grâce au cinéma. Celui-ci bien que qualifié de "muet" à ses débuts ne tarda guère à remédier à cette infirmité. Quelques années plus tard, la télévision vint s’ajouter à ce paysage mais, au fond, pour rapidement devenir de la radio avec des images, l’équilibre n’était décidément pas encore au rendez-vous. Et puis se profile l’ère numérique. Tout devient zéros et uns, images fixes ou animées, sons, textes, et donc tout ce que cela peut servir à exprimer, c’est à dire sentiments, impulsions, questions, mystères. Ceux qui permettent l’accès à cette dimension se rebaptisent fournisseurs de "contenus numériques" et de vastes batailles s’engagent pour la maîtrise de cette nouvelle forme d’oxygène mental et spirituel, encore et toujours la notion de standard, langue universelle poursuivant l’éternel espoir d’un espéranto digital, comme pour réparer la funeste malédiction de la tour de Babel. Il est d’ailleurs passionnant de constater que les seuls intérêts économiques ne sont pas en jeu, mais qu’une bonne part de philosophie et d’humanisme se sert aussi de ces nouveaux véhicules, comme en témoigne le rôle majeur de la communauté Linux, que nous ne pouvons mentionner que brièvement ici, mais dont nous espérons bien pouvoir vous entretenir avec force détails dès la rentrée prochaine. Bref, les nouveaux moyens de communication sont en train de balayer les frontières entre image et son et il nous semble un devoir impérieux de vous en rendre compte, tant ce phénomène apparaît comme générateur d’angoisse dans le petit monde de la musique, du home studio à la multinationale.

Internet2

Ne rêvons pas trop, la diffusion multicanal via Internet n’est à l’heure actuelle qu’un doux rêve que peuvent caresser que les seuls heureux élus connectés à Internet2. Mentionnons tout de même pour mémoire ce nouveau réseau parallèle qui pour l’instant sert uniquement à relier entre elles moins de 200 universités américaines à une vitesse qui laisse rêveur quiconque à déjà utilisé un modem. C’est pourtant là que réside sans doute l’avenir de ces fameux contenus numériques dont nous parlions plus haut, mais il faut bien admettre qu’il risque de se passer un certain temps - pour ne pas dire un temps certain - avant que vous et moi y ayons accès. Pour plus d’informations, une visite à http://www.internet2.edu s’impose. En attendant, essayons de voir ce qu’il est d’ores et déjà possible d’envisager.

Comment produire ?

Ce qui semble aller à l’encontre de tous les schémas de production musicale connus depuis les années 80 est la question de la qualité audio, envisagée sous son aspect le plus technique. Au risque de choquer les âmes sensibles, internet est en train de nous placer devant une évidence que seuls les esprits les plus hardis avaient oser formuler à haute voix jusque là et qui consiste à affirmer qu’à peu près tout le monde se fout royalement du son d’un enregistrement. Pardon d’exprimer cela d’une manière aussi crue, mais pouvons nous croire sérieusement, si le son avait une quelconque importance dans le coeur et les oreilles du public, que l’industrie musicale dans son ensemble (musiciens, ingénieurs, producteurs, studios, etc.) aurait aussi bien accueilli les innovations techniques successives que celui-ci à vécu depuis les Beatles, référence en termes de vente de disques puisque sur notre bonne vieille planète, un être humain sur cinq (y compris les nourrissons et les électeurs fantômes de la capitale) possède au moins un album de ce groupe. En bonne logique, tous auraient du freiner des deux pieds toute nouveauté visant à mettre en péril "une équipe qui gagne". Nous en serions ainsi toujours au quatre pistes à bande, aux micros artisanaux et à l’automation "digitale", au sens de "faite avec les doigts". Seulement voila, Sir Georges Martin soi-même confiait il y a quelques temps à des confrères anglais qu’il aurait bien aimé avoir un 3348 pour les séances des Beatles. Le réseau des réseaux affirme pourtant aujourd’hui haut et fort qu’une simple "maquette", réalisée avec les moyens du bord possède autant de chances d’être téléchargée à 10 millions d’exemplaires qu’un enregistrement effectué à grands renfort de dollars, et c’est bien là ce qui déboussole les passionnés de musique, à commencer par les musiciens. C’est sans doute ce qui explique que nombre d’entre-eux voient encore le son multicanal comme une espèce de gadget avec lequel il est possible, à la rigueur, de s’amuser dans le cadre de musique à l’image mais qui ne constitue pas pour autant un apport significatif à la musique en tant que telle. Nous avons toujours en mémoire le récit d’un grand ingénieur du son français, expliquant que lorsque les premiers magnétophones 4 pistes sont apparus, beaucoup se demandaient ce qu’on allait bien pouvoir faire des deux pistes supplémentaires. Eurêka, c’est pour faire des économies, puisque sur une même bande, on peut enregistrer deux fois plus de musique. C’est un peu là que nous en sommes avec le 5+1. Ce nouveau format ne nous apparaît pas seulement comme un simple mode de diffusion, mais offre un nouvel espace - dans le vrai sens du terme - de composition, d’arrangement et de mixage.

En pratique

Comme nous l’avons dit plus haut, inutile d’espérer d’écouter du 5+1 en direct sur Internet. Toutefois, il existe déjà un nombre impressionnant de radios diffusant en mp3, le site de référence en la matière étant à l’adresse : http://www.live365.com Dans l’éventualité où vous souhaiteriez diffuser vos oeuvres en direct sur le web, un petit tour sur http://www.shoutcast.com pourra vous fournir de précieuses informations. Le mp3 est une chose, mais pour le multicanal, il faut aller plus loin. En effet, ce nom de mp3 est trompeur car il laisse supposer un MPEG-3, qui en fait n’existe plus. A la lecture attentive de ce numéro hors-série, vous aurez donc appris si vous ne le saviez déjà, que MPEG (de Moving Pictures Experts Group) est un ensemble d’outils informatiques de codage de l’image et du son, afin d’en réduire la taille, en termes de poids informatique, mais sans trop en dégrader la qualité. Il existe plusieurs versions de MPEG, les plus connues pour l’instant étant les MPEG-I et MPEG-II. Chacun de ces outils disposent de plusieurs méthodes de travail baptisées "couches" (ou layers en anglais), correspondant à différents modes de compression en fonction - en gros - de la rapidité de lecture, ou de connexion au serveur puisque n’oublions pas que tout ceci à pour objet principal la diffusion. Ainsi, le MPEG Layer 1 propose un taux de compression de 4:1 utilisable pour des taux de transferts partant de 384 kbps alors que le plus puissant MPEG Layer III (mp3) compresse à des taux compris entre 10:1 et 12:1 permettant le transfert d’information à 112 kbps et en deçà. Ceci est valable pour du son en stéréo, le multicanal est encore à venir. Ce que confirme le succès grandissant du DVD qui, rappelons-le au passage, compresse images et sons en MPEG-2.

Perspectives futures

L’industrie audio-visuelle ayant à présent bien compris qu’il n’est plus possible de se contenter de nos formats actuels, le Moving Pictures Experts Group ne cesse de travailler pour améliorer ses diverses technologies. C’est ainsi qu’apparaissent, certes encore timidement, MPEG-4, MPEG-7, et même MPEG-21 comme nous allons le voir. Première innovation, le MPEG-2AAC (pour Advanced Audio Coding). Il s’agit d’emmener plus loin le mp3, en lui ajoutant notamment un système de noise-shaping, un nouveau filtre et une meilleure gestion du taux de transfert. Le MPEG-IIAAC se présente comme la solution pour la diffusion radio sur Internet, et à aussi été choisi comme faisant partie intégrante du MPEG-4. Ce dernier, encore fort peu répandu car non encore complètement standardisé devrait apporter des innovations majeures. Entre autres, possibilité de mélanger un contenu audio et vidéo dit "naturel", c’est à dire enregistré, à un contenu de synthèse, généré à la volée par l’ordinateur. Par exemple, certaines séquences vidéos, ou même les versions multilingues d’un commentaire d’images pourraient être synthétisées économisant ainsi une quantité d’information considérable. Autre innovation, le multiplexage. qui consiste à combiner et de synchroniser différentes sources en temps réel. C’est ici que les choses deviennent véritablement intéressante, car ces capacité font du MPEG-4 un candidat tout à fait valable à la diffusion multicanal puisque un taux de transfert de 384 kbps peut l’autoriser à transmettre 5 canaux d’audio simultanément. Les plus impatients d’entre vous peuvent d’ores et déjà se faire une idée du MPEG-4 en téléchargeant les outils nécessaires à la visualisation et la création d’images fixes (c’est un début) à l’adresse : http://www.e-vue.com Pour la partie audio, les utilisateurs de PC sont favorisés (Win 9x/NT), et peuvent, depuis un bout de temps il est vrai, écouter Public Enemy en mp4 sur le site du groupe : http://www.publicenemy.com Le MPEG-4 devrait également offrir des méthodes de spatialisation sonore, sans doute avec l’appui du groupe de recherche travaillant sur la synthèse et les phénomènes psycho-acoustiques. Les études les plus poussées se font sous l’enseigne du MPEG-7 plus axé sur le développement d’algorithmes de recherche intelligente de contenu, donc sur l’analyse automatique de sons et d’image qui, encore aujourd’hui, est un domaine qui ne peut exclure une intervention subjective, c’est à dire humaine. Il est également question que ce MPEG-7 s’appelle un jour MPEG-12. Enfin, et pour être autant complet que possible, mentionnons tout de même au passage le MPEG-21, encore tout à fait embryonnaire, mais prenant résolument en compte, comme base de départ, le format DVD, donc le son multicanal. Comme pour ses prédécesseurs, les sources d’informations sont essentiellement d’origine universitaire, et disponibles sur l’un des sites officiels : http://www.cselt.it/mpeg/ A ne pas rater non plus, le site http://www.mpeg.org

En conclusion

Comme l’indique le titre de cet article, le son multicanal sur Internet, c’est aujourd’hui, dans la mesure ou certains des groupes de recherche mentionnés plus haut travaillent depuis plus de cinq ans sur ces questions. D’un autre côté, ce n’est pas non plus pour demain car de telles innovations réclameront une qualité de connexion au réseau nettement supérieure à ce qu’elle est aujourd’hui, de même qu’une puissance informatique accrue. Ce qu’il nous semble important de souligner est que l’ensemble des recherches effectuées le sont autant dans le domaine de l’image que du son, ce qui à notre avis ne manquera pas d’influencer les créateurs de tout poil. Les moyens de production d’images étant en train de suivre le processus de démocratisation que le son a connu ces dernières années, le home studio de demain sera multimédia ou ne sera pas, et il y a fort à parier que la prochaine génération d’artistes saura mélanger sur sa palette sons, images (naturels ou synthétisés) et pages web. Un dernier lien pour le plaisir et pour la route : http://www.ez3kiel.com

Tags: