Jukebox est un système d’intelligence artificielle basé sur le machine learning, capable de mélanger les genres musicaux et les instruments pour créer une musique de toutes pièces. Vous allez découvrir que les dernières créations de l’intelligence artificielle d’OpenAI ressemblent étrangement aux sonorités du King Elvis Presley.

Jukebox peut créer un son de A à Z

Il y a un an, OpenAI présentait MuseNet. Une autre intelligence artificielle capable de générer des sons. Un système intelligent capable de prêter attention à une musique en particulier pendant de longues minutes, dans le but de la comprendre parfaitement. L’IA peut donc comprendre le contexte général des mélodies d’une chanson, plutôt que la façon dont elles se succèdent dans une courte section. Objectif : prédire la suite de la chanson avant même qu’elle ne l’ait entendue.

Jukebox est une version améliorée de MuseNet, une autre IA d’OpenAI. Plus que prédire la suite d’une musique, cette nouvelle intelligence artificielle est capable de créer des sons de A à Z. Un peu comme Amadeus Code, une IA compositrice créée par Jun Inoue, Gyo Kitagawa et Taishi Fukuyama.

La solution imaginée par OpenAI est capable de composer une chanson en choisissant les bons instruments, en mélangeant les styles et en définissant un texte avec des paroles plus ou moins claires… On vous laisse écouter :

Une IA puissante mais inutile ?

Pour parvenir à cette prouesse, Jukebox décompose des musiques existantes en différents « morceaux » puis reconstruit une piste finale. C’est le cœur des nouvelles recherches d’OpenAI. Les ordinateurs n’ont pas la capacité de mémoriser du texte. Si cette tâche semble simple car elle est innée chez l’humain, les machines ont besoin d’un apprentissage poussé pour y parvenir.

L’IA doit donc apprendre à choisir une voix, à comprendre ce qu’elle dit et harmoniser la tonalité, le tempo et tout le reste. Jukebox est l’une des rares intelligences artificielles au monde à être capable d’une telle prouesse. Formé à partir de 1,2 million de chansons, le système possède plusieurs facettes, mais l’improvisation reste la mission principale de cette IA.

Jukebox peut donc utiliser la voix d’Elvis Presley ou d’Eminem et leur faire dire n’importe quoi. Comme MuseNet, Jukebox est également capable d’assimiler les 12 premières secondes d’une chanson pour générer la suite dans un style similaire. Malgré de grandes capacités les concepteurs de Jukebox disent que :

« Nous avons partagé Jukebox avec un ensemble de 10 musiciens de différents genres… malheureusement ces musiciens n’ont pas trouvé que notre invention était immédiatement applicable à leur processus de création ».