Divertissement Intelligence Artificielle

Des IA de DeepMind jouent mieux à Quake III que l’Homme

La tendance dans l’intelligence artificielle est aux jeux vidéo. Dernièrement, OpenAi, une société cofondée par Elon Musk, a réussi a mettre a tapis des joueurs sur Dota 2. Pour ce faire, OpenAI Five est arrivée avec 180 années de temps de jeu à son compteur. 65 700 jours à jouer contre elle-même. Impossible pour un être humain de rivaliser.

Plus modestement, DeepMind, société appartenant à Google, a débuté des essais sur des jeux Atari. Des schémas basiques qui sont assez simples à appréhender pour une machine. Afin de monter en puissance, la firme a décidé de se lancer sur une adaptation de Quake III et son mode de capture de drapeaux.

L’objectif pour le système ici est d’apprendre à se déplacer dans un environnement en 3D qui peut parfois être complexe. Chaque carte était générée aléatoirement. Pour y arriver, les robots ont effectué plus de 450 000 parties contre elles-mêmes. Au départ, ils n’ont reçu aucune instruction, l’apprentissage se fait donc en retenant les erreurs commises. Comme chez OpenAI, les robots de DeepMind n’ont pas uniquement appris les règles basiques du jeu, elles sont allées au-delà. Elles ont développé des stratégies sur la protection de leur drapeau, le fait de se cacher dans le camp adverse, ou se déplacer à plusieurs.

Pour évaluer les capacités de ses machines, Google a opposé des équipes de deux. Plusieurs formules ont été testées : 2 robots contre 2 humains, 1 robot et 1 humain contre 1 robot et un humain. Au final, l’équipe constituée de robots a obtenu de meilleurs résultats. Le score de victoires a été de 74%. Des humains normaux obtiennent un score de 43%, et de bons joueurs ont un score de 52%. Un autre test mené avec une équipe de quatre robots a obtenu un score de 65%. Cela nuance les performances de ces IA démontrant que le travail en équipe requiert plus d’expérience.

Il y a encore certainement une marge d’ici à ce que les cerveaux de DeepMind en viennent à faire du rocket jump, ou anticipent les déplacements et les rebonds du lance-grenades. Quoi qu’il en soit, à l’instar du système créé par OpenAI, les intelligences artificielles se mettent au jeu vidéo et obtiennent des scores impressionnants. En même temps, quel humain pourrait être dans une phase d’apprentissage continue pour apprendre de ses erreurs ?

Send this to a friend