Après que le New York Times (NYT) ait porté plainte contre OpenAI, le 27 décembre, l’accusant d’avoir utilisé sans son accord, plusieurs millions d’articles pour former ses grands modèles de langage (LLM), la start-up spécialisée dans l’intelligence artificielle (IA) générative a tenu à se défendre. Le 8 janvier, OpenAI a affirmé que le journal avait « intentionnellement manipulé » son chatbot afin qu’il ressorte des pans entiers des articles du New York Times.
OpenAI contre-attaque face au New York Times
Dans un billet de blog OpenAI a affirmé que la plainte déposée par l’organe de presse était « sans fondement », assurant que le New York Times ne « racontait pas toute l’histoire ». La firme de Sam Altman a affirmé qu’elle n’a pas plagié le contenu du média, évoquant le « fair use », également appelé « droit de citation », qui autorise l’utilisation d’œuvres protégées par le droit d’auteur dans certaines situations.
Inscrivez-vous à la newsletter
En vous inscrivant vous acceptez notre politique de protection des données personnelles.
Dans sa plainte pour violation du droit d’auteur, le NYT considérait que ChatGPT régurgitait des extraits entiers de ses articles. OpenAI répond qu’il s’agit d’un phénomène de « mémorisation par inadvertance ». L’entreprise a assuré qu’elle s’évertuait à éviter que de tels incidents ne puissent se reproduire. Pour le groupe, les exemples mis en avant par le journal sont issus d’anciens articles publiés sur un certain nombre de sites tiers.
« Il semble que le New York Times ait intentionnellement manipulé les commandes, incluant souvent de longs extraits d’articles, afin de les faire régurgiter par notre modèle, » a déclaré la société avant d’ajouter que « nos modèles ne se comportent généralement pas comme le laisse entendre le New York Times, ce qui suggère qu’ils ont soit demandé au modèle de régurgiter, soit sélectionné leurs exemples parmi de nombreuses tentatives ».
OpenAI a évoqué la mise en place d’un système durant l’été dernier, permettant aux éditeurs de lui interdire d’exploiter leurs contenus. Une initiative qui aurait été adoptée par le New York Times lorsqu’elle a interdit aux développeurs de ne pas exploiter ses contenus en août 2023. Enfin, la start-up s’est montrée surprise de la tournure des évènements puisqu’elle considérait, par le passé, avoir eu des discussions productives avec le journal autour d’un éventuel partenariat.
Pour l’avocat du NYT, Ian Crosby, OpenAI admet avoir utilisé les travaux réalisés par le média, ainsi que celui de nombreux autres, pour concevoir ChatGPT. « OpenAI a cherché à profiter gratuitement de l’investissement massif du Times dans son journalisme en l’utilisant pour créer des produits de substitution sans autorisation ni paiement. Ce n’est en aucun cas, un usage équitable, » précise l’homme de loi. À noter que le NYT a demandé à l’entreprise de détruire toutes les données de formation, ainsi que les modèles de robot conversationnels qui utilisent son contenu.