Meta a dévoilé l’une de ses intelligences artificielles (IA) Cicero, le 22 novembre, dans la revue Science. Comme l’homme politique romain du 1er siècle av. J.-C. dont elle partage le patronyme, elle excelle dans l’art de la négociation. L’IA a brillé dans un jeu de société, jouable en ligne, Diplomacy, qui requiert des compétences poussées de langage naturel et stratégique.

DeepBlue, AlphaGo, Pluribus… Et Cicero ?

Fier de sa création, Meta n’hésite pas à la placer dans la lignée prestigieuse de DeepBlue, qui a battu Kasparov aux échecs en 1997, AlphaGo qui a vaincu Lee Sedol au jeu de Go en 2015 ou Pluribus, qui a dépouillé les meilleurs joueurs de Poker. La performance de Cicero est de s’être classé dans les 10 % meilleurs joueurs du jeu en ligne Diplomacy.

Diplomacy est un jeu de société américain à succès, créé à la fin des années 50. Dans l’idéal, sept joueurs se partagent les grandes puissances européennes du début du XXe siècle et tentent de parvenir à conquérir la moitié de la carte. Il est basé sur des jeux d’alliances et des trahisons pour obtenir la victoire finale.

Dans son communiqué, Meta explique que Diplomacy est un défi pour l’IA, « il exige des joueurs qu'ils maîtrisent l'art de comprendre les motivations et les points de vue des autres, qu'ils élaborent des plans complexes et adaptent leurs stratégies, puis qu'ils utilisent le langage naturel pour conclure des accords avec d'autres personnes, les convaincre de former des partenariats et des alliances, etc. » Contrairement aux échecs ou au Go, l’intelligence stratégique à elle seule ne suffit pas.

C’est en mêlant les compétences d’IA à raisonnement stratégique avec des celle des systèmes de traitement du langage naturel, comme GPT-3, que Meta est arrivé à Cicero, désigné « modèle de dialogue contrôlable ». Andrew Goff, un champion du jeu, l’a décrite comme « impitoyable dans l'exécution de sa stratégie, mais pas impitoyable au point d'ennuyer ou de frustrer les autres joueurs ».

Cicero est parvenue à travailler avec les joueurs en examinant à chaque tour la situation sur le plateau et les historiques discussions. De cette façon, elle réussit à anticiper les plans de ses adversaires et d’en élaborer en conséquence, exécutés grâce au modèle linguistique. Meta rapporte que « Cicero peut déduire, par exemple, que plus tard dans le jeu, il aura besoin du soutien d'un joueur particulier, puis élaborer une stratégie pour gagner les faveurs de cette personne - et même reconnaître les risques et les opportunités que ce joueur voit de son point de vue particulier ».

Meto appelle les chercheurs en IA à améliorer Cicero, en faisant preuve de « responsabilité »

Meta, manifestement content de sa diplomate en herbe, souvent préférée comme allié par les joueurs humains, concède qu’elle a des failles. Des dialogues parfois incohérents et contreproductifs avec des joueurs. Le code de Cicero a été mis à disposition sur GitHub, « nous espérons que les chercheurs en IA pourront continuer à s'appuyer sur notre travail de manière responsable », affirme l’entreprise. Elle précise, par ailleurs, avoir déjà pris des mesures pour éviter des « messages toxiques », un classique des IA conversationnelles.

Cicero est uniquement utilisable pour le jeu Diplomacy à ce jour. Meta espère que ses résultats permettront à terme d’améliorer la compréhension entre les IA et les humains. La société suggère par exemple de s’en servir pour transformer les PNJ (personnages non joueurs) sur les jeux vidéo, en interlocuteurs plus crédibles que jamais.