Entreprise - Nouvelles technologies

Ircam Amplify, une pépite française encore fragile

Par Jean-Christophe Castelain · Le Journal des Arts

Le 29 juin 2022 - 1699 mots

PARIS

La filiale commerciale de l’Ircam dispose d’un savoir-faire reconnu dans le design sonore qui mériterait de recevoir plus de moyens pour lutter contre les géants du secteur.

"Maestra, maestro" à la Philharmonie des enfants : l'enfant est placé dans la peau d'un chef d'orchestre dirigeant un orchestre symphonique. L'expérience est réalisée avec le concours d'IRCAM Amplify. © Nora Houguenade
"Maestra, maestro" à la Philharmonie des enfants : l'enfant est placé dans la peau d'un chef d'orchestre dirigeant un orchestre symphonique. L'expérience est réalisée avec le concours d'IRCAM Amplify.
© Nora Houguenade

France. C’est l’exemple type d’une société technologique française, mi-publique mi-privée, peu connue du grand public et qui pourrait devenir un géant dans son secteur si on lui donnait plus d’argent. Et pourtant Ircam Amplify a des « parents » renommés, le Centre Pompidou et l’Ircam (Institut de recherche et coordination acoustique / musique), fondé en 1977 par Pierre Boulez et dirigé depuis 2006 par Frank Madlener. La filiale commerciale de l’Ircam a été créée sous forme de SAS en juillet 2019, avec comme autres actionnaires, outre l’Ircam (qui conserve 59,54 % des parts), la Caisse des dépôts (deuxième plus gros actionnaire), Believe – une entreprise française qui possède des labels musicaux –, la société de conseil E.T.R.E et la société Numeric Pipeline.

Ircam Amplify, dirigée depuis ses débuts par Nathalie Birocheau [lire encadré ci-dessous] exploite les ressources techniques d’une centaine de chercheurs réunis au sein d’une Unité mixte de recherche (l’UMR STMS) pour vendre des solutions aux entreprises privées dans le domaine du son. Cette UMR associe des partenaires aussi prestigieux que l’Ircam, le CNRS et l’université de la Sorbonne. Le domaine du son qui semble mineur, de prime abord, est en réalité au début d’une véritable révolution qui concernera tout le monde, avec des enjeux économiques gigantesques : les industries culturelles« qui sont de plus en plus exigeantes sur la qualité du son », explique Frank Madlener, mais aussi l’industrie automobile, la santé…

Le grand public a pu entendre un bout de cette révolution dans la nouvelle émission de Thierry Ardisson sur France 3 en mai dernier : « L’hôtel du temps ». Dans ce premier numéro, l’animateur présente une interview supposée réalisée aujourd’hui avec la chanteuse Dalida, pourtant décédée il y a trente-cinq ans. Pour l’image, il a utilisé une actrice sur le visage de laquelle il a « collé », au montage, celui de la chanteuse. Et pour sa voix, il a fait appel à Ircam Amplify qui a transformé ce que dit la comédienne en la véritable voix de la chanteuse. Les chercheurs de l’UMR ont « appris » à un ordinateur les intonations, les caractéristiques de la voix de Dalida, de sorte que le système a pu cloner celle de la comédienne.

Le résultat très probant n’est pas sans poser des questions : il est aujourd’hui possible de fabriquer de fausses vidéos où l’on fait dire à une personnalité connue ce que l’on veut. Très consciente d’un tel risque, Nathalie Birocheau assure que les chercheurs de l’UMR collaborent avec des laboratoires qui travaillent sur la détection de fake voices [fausses voix].

La fabrication de voix de synthèse est l’une des technologies utilisées « dans les trois domaines dans lequel opère Ircam Amplify : l’interaction, l’espace et la data », explique Nathalie Birocheau, « nous voulons ajouter de l’émotion, de la finesse, de la singularité dans ces voix ». Au-delà de la vraie fausse interview de Dalida, l’interaction homme / machine revêt de multiples aspects très sérieux. Si les systèmes à commande vocale se multiplient, que ce soit avec les assistants de type Google Home ou Amazon Alexa, avec son smartphone (Apple Siri) ou en voiture, l’enjeu est aujourd’hui double : permettre, d’une part, à ces systèmes de saisir l’humeur de l’humain qui leur parle afin, d’autre part, de lui répondre avec le ton de voix approprié. La voix synthétique est, en somme, comme un gestionnaire de stress. Et du confort à la santé, il n’y a qu’un pas. Ircam Amplify a justement développé une technologie qui aide les humains à bien utiliser leur voix, en groupe ou en conférence. Initialement réservée aux enseignants affiliés à la mutuelle MGEN, la solution issue de cette technologie est aujourd’hui disponible pour tous sous forme d’une appli : Vocaliz.

Le deuxième domaine d’intervention de la start-up est l’espace sonore. De plus en plus de lieux vont souhaiter offrir à leurs utilisateurs un son 3D, un son immersif plus proche de la réalité que les sons en stéréo : les salles de cinéma, les habitacles intérieurs de voiture… Elle commercialise le logiciel Spat qui permet de produire et de diffuser de tels sons immersifs.

Parmi les nombreux concurrents positionnés depuis longtemps sur ce secteur, il y a la société Dolby Laboratories avec sa solution Dolby Atmos. Le chiffre d’affaires de la société américaine dépasse le milliard de dollars. L’un des enjeux dans ce domaine est d’automatiser la transformation du répertoire musical mondial en son immersif.

L’indexation des bases musicales

Car, et c’est le troisième domaine d’Ircam Amplify, les volumes de morceaux enregistrés (en numérique) sont considérables. Il y en aurait plus de 70 millions, un chiffre qui augmente chaque année dans de fortes proportions depuis que les compositeurs peuvent s’auto-éditer en numérique. Outre leur transformation en son 3D, il s’agit de s’y retrouver dans cette masse afin de pouvoir en tirer le meilleur parti. Selon certaines études, seuls 50 000 titres parmi ces 70 millions seraient écoutés. Les premiers demandeurs sont donc les plateformes de musique (Spotify, Deezer) qui ont besoin d’aller au-delà des métadonnées classiques – nom de l’artiste, titre, genre musical… – afin de constituer des playlists ou faire des recommandations à leurs utilisateurs sur des critères plus subtils : une musique joyeuse, triste, calme… Encore faut-il avoir ainsi qualifié les musiques ! Mais compte tenu des volumes, cette qualification ne peut pas être faite par des hommes, mais par des machines. Ircam Amplify a justement développé une solution informatique qui permet de qualifier les bases musicales selon de multiples critères et de les indexer.

On le voit, les marchés pour toutes ces solutions sont nombreux, divers et plutôt porteurs. Un autre marché pourrait même être tout aussi important : celui des signatures sonores des marques. Tout le monde connaît le logo visuel de Nike, par exemple – la fameuse virgule –, mais pourquoi Nike n’aurait-il pas aussi un logo sonore ? Pas le jingle qui accompagne certaines publicités, mais une signature sonore avec un son immersif, dont les émotions portent les valeurs de la marque ? À l’heure où le métavers, ces mondes parallèles virtuels, commence à se dessiner, le design sonore va devenir de plus en plus prépondérant.

Chiffre d’affaires et prises de participation

Le modèle économique de la SAS est double. Le flux des recettes immédiates est assuré par la vente de solutions à des clients spécifiques, comme pour Thierry Ardisson – une prestation qui aurait été facturée quelques dizaines de milliers d’euros par émission. Lorsque les solutions packagées n’existent pas encore, la démarche consiste à en mettre une au point qui réponde à une demande particulière, puis à prospecter le secteur pour la vendre à d’autres clients qui auraient des besoins similaires. Selon différentes sources, le chiffre d’affaires annuel d’Ircam Amplify serait de l’ordre de 1 million d’euros avec un portefeuille d’une trentaine de clients.

Mais Ircam Amplify souhaite aussi développer un canal de revenus à long terme à travers des prises de participation dans des start-up qui utilisent des technologies de l’Ircam. Cette volonté est née d’un traumatisme, lui-même à l’origine de la création de la SAS : le départ, en 2013, de trois chercheurs de l’Ircam qui ont emporté les technologies d’enrichissement de métadonnées et de moteur de recommandations qu’ils avaient contribué à développer et qui ont créé leur propre start-up, Niland. Et Niland a été achetée quatre ans plus tard par Spotify pour une somme rondelette. Ici, le modèle d’affaires consiste à accompagner ces start-up dans un modèle classique de Business Angels [« investisseur providentiel »] et de les revendre au bout de quelques années en espérant empocher le jackpot.

À ce jour, Ircam détient des participations dans trois jeunes pousses. HyVibe qui vend des guitares équipées d’un dispositif numérique permettant de produire des effets (amplification, etc.), Antesfosco qui commercialise l’appli Metronaut offrant un accompagnement musical aux musiciens de classique et Mogees qui transforme un objet (un arbre, une table…) en instrument de musique après avoir placé un dispositif numérique sur l’objet en question.

Un financement insuffisant

Vertueux parce qu’ils ont permis à l’Ircam de commercialiser plus efficacement ses technologies, les moyens donnés à Ircam Amplify sont encore trop limités pour affronter les géants de l’Internet. En deux levées de fonds (1,8 M€ en 2020 et 1,2 M€ en 2021), la SAS a ainsi pu réunir 3 millions d’euros auprès de la Caisse de dépôts via le quatrième Programme d’investissement d’avenir (PIA4) et l’arrivée à son capital de trois investisseurs privés. La présence de ces investisseurs privés au capital, parfois concurrents des clients d’Ircam Amplify n’est-elle pas un problème ? Nathalie Birocheau l’assure : « Cet actionnariat qui nous permet d’accélérer notre développement est étanche avec l’activité opérationnelle de la société. »

Nathalie Birocheau ne veut pas entrer dans le détail des apports mais, en supposant que l’État ait financé 2 millions d’euros sur les 3 millions via le PIA4, cela semble bien faible en regard des 20 milliards d’euros du PIA4. Il en faudrait au moins dix fois plus pour commencer à prendre des positions solides sur un marché en pleine expansion. La petite structure de dix personnes peut certes s’appuyer sur un laboratoire de cent chercheurs, mais que pèse cet ensemble face aux Gafam ? La France a une chance unique d’être un acteur de poids dans cette nouvelle étape de la révolution du numérique dans le domaine du son. Saura-t-elle s’en saisir et transformer un savoir-faire reconnu dans le monde artistique en solutions planétaires ?

Nathalie Birocheau, supersonique  

PORTRAIT. Difficile de suivre la directrice générale d’Ircam Amplify tant elle va vite. La jeune femme de 37 ans a déjà trois enfants et un parcours impressionnant. Après des études d’ingénieur à Supélec, puis à Polytechnique Montréal, elle entame une carrière de consultante dans le domaine culturel qui l’amène à travailler pour la Fondation Louis Vuitton ou le Musée du Louvre, avant de rejoindre Radio France, en 2012, où elle pilote le chantier de restauration de la maison ronde. En 2016, elle reste dans le giron de l’audiovisuel public et devient directrice adjointe de France Info. Artiste peintre à ses heures, Nathalie Birocheau déroule ses arguments avec fougue et technicité, très consciente des enjeux mais aussi des difficultés à affronter.

Cet article a été publié dans Le Journal des Arts n°592 du 24 juin 2022, avec le titre suivant : Ircam Amplify, une pépite française encore fragile La filiale commerciale de l’Ircam dispose d’un savoir-faire reconnu dans le design sonore qui mériterait de recevoir plus de moyens pour lutter contre les géants du secteur

Tous les articles dans Actualités

Le Journal des Arts.fr

Inscription newsletter

Recevez quotidiennement l'essentiel de l'actualité de l'art et de son marché.

En kiosque