Nous savions déjà que DeepMind était en mesure de détecter le cancer du sein de façon plus précise qu’un médecin, ou que l’intelligence artificielle était en mesure de prévenir 48h à l’avance d’une insuffisance rénale aiguë. Aujourd’hui, le système d’intelligence artificielle est capable de deux nouvelles choses, bien plus légères : insérer des clés USB et empiler des blocs de couleurs.

Un robot capable d’effectuer des tâches compliquées mieux qu’un humain

En s’appuyant sur une étude publiée en 2020, VentureBeat relate une nouvelle technique d’apprentissage mise au point par les équipes de DeepMind. Un membre de l’équipe a déclaré à propos de cette technique qu’il était en fait question “d’une approche qui permet de développer des moments de la vie réelle en robotique, car nous n’avons plus besoin de faire fonctionner le robot pour chaque étape d’apprentissage. Nous montrons que les agents que nous avons formés, une fois déployés dans de vrais robots, peuvent effectuer une variété de tâches difficiles qui impliquent de nombreuses interactions avec des objets parfois rigides et tantôt déformable. Dans certains cas, ils surpassent même la réalisation de tâche effectuée par un humain”.

Ce qui est ici expliqué c’est qu’aujourd’hui, un robot va avoir tendance à s’appuyer sur des exemples de réalisation réussis d’une tâche, pour avoir plus de chances de l’effectuer correctement. Les démonstrations de la tâche réussie vont aider le robot à assimiler l’apprentissage, la récompense. Dans cette approche, toutes les informations glanées par le robot, que ce soit les démonstration, les trajectoires effectuées pour une tâche et d’autres éléments encore, sont accumulées dans le NES, un système de stockage. Ce NES va permettre de former à 75% un agent qui sera, par la suite, intégré à un robot. Les 25% seront des éléments liés précisément à la tâche à accomplir.

Le robot utilisé par DeepMind a réussi à mener ses tâches dans 80% des cas

Pour mener leurs expériences à bien, les équipes de DeepMind ont utilisé un robot Sawyer, équipé d’une pince et d’un capteur au poignet. Plusieurs caméras leurs ont permis d’obtenir de nombreuses informations et pas moins de 400 heures de vidéos au total.

Lors des expériences, le robot Sawyer a été en mesure d’empiler des cubes de couleurs dans 80% des cas. Cependant, lorsque les cubes étaient initialement positionnés de façon contradictoire, il a eu plus de difficultés et n’a obtenu que 40% de réussite.

deepmind et les cubes

Crédits : Deepmind

Par ailleurs, une autre tâche qui a été confiée au robot consistait en insérer une clé USB dans un port d’ordinateur : sur 8 heures d’exercice, le robot a obtenu plus de 80% de réussite. Pour les chercheurs, “grâce à un système multi-composants permet à un robot de résoudre une variété de tâches difficiles qui nécessitent d’être habile dans sa manipulation, et qui implique une interaction multi-objets et de nombreuses heures pour effectuer différentes étapes”.

Les chercheurs de DeepMind devront désormais trouver les moyens de minimiser la formation de l’homme dans la boucle, et de réduire autant que possible la sensibilité des agents, notamment leur sensibilité face aux “perturbations”