Si OpenAI et DeepMind ont été précurseurs dans l’étude de l’intelligence artificielle au sein d’un environnement virtuel comme les jeux vidéo, Ubisoft a aussi voulu développer son propre système, pour un jeu de course.

Ubisoft a voulu créer un algorithme simple

Contrairement aux intelligences artificielles de ses concurrents, celle d’Ubisoft est volontairement simple, capable de maîtriser des actions binaires dans The Crew, un jeu de course. Ubisoft veut avant tout que son algorithme puisse répondre aux contraintes de l’industrie du jeu vidéo. Les chercheurs à l’origine de cet algorithme expliquent que :

“Les applications de l’apprentissage par renforcement dans les jeux vidéo ont connu des avancées massives au cours des dernières années. Les différentes communautés de chercheurs ont formé des agents pour être compétitifs avec les meilleurs joueurs du monde dans des jeux complexes. Chez Ubisoft, nous faisons le constat que ces systèmes ont été très peu utilisés dans l’industrie du jeu vidéo, et nous pensons que nous devons les démocratiser.

Les chercheurs d’Ubisoft estiment que les prouesses réalisées grâce à l’intelligence artificielle vont bien au-delà des ressources technologiques disponibles dans les studios de jeux vidéo et que les concepteurs ne peuvent pas les intégrer pour le grand public. Ubisoft a donc voulu concevoir une approche “simple” pour intégrer leur algorithme dans un jeu vidéo le plus rapidement possible. Leur solution est basée sur l’architecture Soft Actor-Critic, développée par des chercheurs de l’Université de Berkeley en Californie.

Un jeu de course pas comme les autres

L’équipe d’Ubisoft a testé son système d’intelligence artificielle dans des environnement différents. Premièrement dans un jeu de football, mais les performances étaient légèrement inférieures à celles déjà existantes dans l’industrie du jeu vidéo. Ils ont ensuite testé leur système pour entraîner un véhicule à se conduire seul dans un jeu de course. C’est à ce moment précis qu’ils se sont aperçus du potentiel de leur méthode d’apprentissage.

Concrètement, l’algorithme développé permet à l’agent de réaliser deux actions simples : accélération (et décélération) et direction. L’objectif est de suivre un chemin précis le plus rapidement possible dans un environnement que l’agent n’a pas rencontré pendant sa formation. Les chercheurs estiment que : “nous avons montré que le Soft Actor-Critic peut être appliqué avec succès pour former une voiture à une tâche de conduite à grande vitesse dans un jeu vidéo commercial”. Contrairement aux approches complexes d’OpenAI et de DeepMind, ce type d’algorithme pourrait être implémenté très rapidement dans un futur jeu.