Plusieurs chercheurs de Google AI, la division de recherche sur l’intelligence artificielle de la firme de Mountain View, ont présenté le 2 novembre 2022, leur dernière trouvaille. Ils ont réussi à mettre en place un outil qui permet, à l’aide du langage naturel, de proposer à un robot d’effectuer en tâche pour laquelle il n’a pas été programmé initialement.

L’intelligence artificielle au service de l’industrie

Dans un billet de blog, Jacky Liang et Andy Zeng, deux chercheurs pour Google AI, ont présenté leur création baptisée Code as Policies (CaP). Pour mettre au point leur outil, ils se sont basés sur le constat suivant : avant qu’un fabricant puisse déployer un robot dans une usine, il est obligé de personnaliser celui-ci en fonction de ses besoins. Pour y parvenir, il doit rédiger du code qui permettra au robot de savoir quelle tâche il doit réaliser.

À chaque fois qu’il souhaite former un robot pour qu’il puisse effectuer une nouvelle tâche qu’il ne connaît pas, il doit rédiger le code qui lui permettra d’y parvenir. Ce processus est évidemment long et fastidieux, et fait perdre un temps de production précieux. Les chercheurs de Google ont donc essayé de trouver une solution à cela grâce à l’intelligence artificielle.

« CaP permet à un seul système d’effectuer une variété de tâches robotiques complexes et variées sans formation spécifique à la tâche », précisent les deux spécialistes.

Image montrant plusieurs exemples de tâches ayant été apprises par un robot grâce à CaP.

CaP est capable de former rapidement un robot afin qu’il effectue certaines tâches, ce qui est très utile pour le travail à la chaîne notamment. Image : Google.

Comment fonctionne CaP, le nouvel outil de génération de code de Google

Pour mettre en place leur outil, les chercheurs ont développé un modèle d’IA capable d’écrire du code en fonction des commandes en langage naturel écrite par un utilisateur. CaP génère ainsi du code en Python, ce qui permet ensuite à un robot d’effectuer les tâches adéquates à la demande. Initialement, les chercheurs se sont basés sur un modèle qui n’était pas conçu pour générer du code pour configurer des robots.

Ils ont simplement repris cette IA et l’ont modifié de telle manière à ce que l’on passe d’un modèle de machine learning, qui nécessite un grand nombre d’exemples, à du few-shot learning, qui permet d’utiliser seulement quelques exemples pour entraîner le robot à effectuer une tâche, accélérant sa formation. En plus de produire du nouveau code, l’outil s’appuie sur des bibliothèques de logiciels, des collections de code déjà rédigées automatisant les tâches les plus courantes. Il peut ainsi se baser sur ces ressources pour satisfaire les demandes de l’utilisateur.

Schéma expliquant le fonctionnement de l'outil de programmation de Google, CaP.

Code as Policies utilise un modèle qui traduit le langage naturel en code. Cela permet de former les robots afin qu’ils réalisent les tâches demandées. Image : Google.

Cet outil reste assez différent des modèles Low-Code/No-Code qui ont vraiment pour objectif de rédiger du code à la demande d’un utilisateur afin qu’il l’exploite par la suite pour créer ses propres modèles/outils. CaP, lui, a vraiment pour objectif de former un robot en lui fournissant un code prêt à l’emploi qui lui permet de réaliser une tâche sur mesure.

Code as Policies est disponible depuis le début du mois de novembre 2022 sur GitHub, en open source.