Alors que l’engouement autour de l’intelligence artificielle (IA) bat son plein, Meta annonçait, il y a deux semaines la sortie de LLaMA, son modèle de langage open source. Celui-ci est avant tout dédié à la recherche et disponible uniquement aux chercheurs qui en font la demande. Pour autant, le 3 mars dernier, l’entièreté du système a fuité sur le forum 4chan, permettant à tout le monde de le télécharger. Cet événement a ouvert le débat, au sein de la communauté scientifique, sur la nécessité de rendre accessible à tous ce type de modèle de langage.

Il aura fallu seulement une semaine pour que LLaMA soit rendu public de manière illégale. « Le modèle de langage aux 65 milliards de paramètres de Meta vient d’être partagé sur Internet, c’était rapide », a écrit sur Twitter Jeffrey Ladish, chercheur en cybersécurité, au moment des faits. Il conseille de se préparer « à recevoir des tonnes de spams personnalisés et de tentatives d’hameçonnage. Rendre ce modèle open source était une très mauvaise idée ».

Well Meta's 65 billion parameter language model just got leaked to the public internet, that was fast.

Get ready for loads of personalized spam and phishing attempts. Open sourcing these models was a terrible idea

— Jeffrey Ladish (@JeffLadish) March 4, 2023