Universal Music Group (UMG), un tiers du marché mondial de la musique, a envoyé des mails à Spotify, Apple et d’autres plateformes de streaming pour les sommer de protéger ses artistes de l’Intelligence artificielle (IA). Le groupe, dont l’actionnaire le plus important est Vincent Bolloré, veut empêcher les IA génératives de s’entraîner sur les contenus sous copyright.

L’IA ne touchera pas aux artistes UMG

Pour qu’une IA générative, type ChatGPT, puisse répondre le plus justement possible à ses utilisateurs, il n’y a pas de secret : l’entraînement. Pour que le système propose à partir de texte, des images, de la musique, d’autres textes, il a besoin d’ingurgiter de grandes masses de données.

Afin d’associer la poésie de textes inspirés de Slipknot avec une voix percutante évoquant Carla Bruni, une IA a besoin de connaître textes et mélodies de l’un et de l’autre. C’est tout le problème d’UMG, qui y perçoit une violation du droit d’auteur.

Dans des mails envoyés mi-mars et en partie révélés par le Financial Times, le label se plaint, « que certains systèmes d’IA pourraient avoir été formés sur du contenu protégé par le droit d’auteur sans obtenir les consentements requis de la part des titulaires de droits qui possèdent ou produisent le contenu ou sans verser de compensation à ceux-ci ». Il aurait menacé de « prendre des mesures pour protéger nos droits et ceux de nos artistes ».

À la même période, un rapport de la Fédération internationale de l’industrie phonographique (IFPI) s’alarmait déjà du phénomène. Michael Nash, directeur du numérique d’UMG y décrivait un problème « en tête de liste » de ceux de l’industrie.

OpenAI, le créateur de ChatGPT, dispose de son équivalent pour la musique, JukeBox. Sur la page de présentation de l’outil, il est mentionné que « pour former ce modèle, nous avons exploré le Web pour organiser un ensemble de données de 1,2 million de chansons ». Il n’est pas précisé si elles sont libres de droits. À la fin de la page, il est simplement signalé que des recherches sont menées sur la question des droits de propriété intellectuelle.

Le Financial Times rapporte également l’existence de MusicLM, de Google. Ce modèle qui génère la musique à partir de texte n’est pas sorti. Il a été entraîné avec 280 000 heures de musique, mais les chercheurs à son origine ont compris que 1 % des musiques créées étaient assimilables à du plagiat.

La question du droit d’auteur se pose dans tout le secteur

Michael Nash voit dans l’émergence de l’IA générative des similitudes avec Napster. L’ancêtre du peer-to-peer qui a ébranlé l’industrie musicale, sauvée par le droit d’auteur. L’IA générative bénéficie encore d’un certain flou juridique, mais celui-ci pourrait se dissiper.

Outre les divers projets de régulations en réflexion à travers le monde, une affaire impliquant les IA génératives d’images devrait avoir d’importante répercussion. Le domaine de l’image, avec Dall-E 2, toujours d’OpenAI, ou Midjourney, est traversé par les mêmes questionnements. Début janvier trois artistes ont déposé une plainte aux États-Unis pour atteinte aux droits d’auteur. La célèbre banque de données d’images Getty a également lancé une procédure contre Stability AI pour son outil Stable diffusion. En attendant l’encadrement légal des IA génératives, la justice américaine sera appelée à trancher ces questions de droit d’auteur.