Depuis la fin du mois de mai, Bing intégrait ChatGPT. Le moteur de recherche de Microsoft permet aux abonnés à ChatGPT Plus, la version premium du service, d’obtenir des réponses plus précises à leurs requêtes grâce à une base de données remontant jusqu’à septembre 2021. Alors que la fonctionnalité est toujours en phase de bêta, OpenAI a annoncé la mettre en pause afin de corriger quelques erreurs. Celle-ci était capable de récupérer l’intégralité d’un contenu protégé par un paywall.

Le droit d’auteur et l’IA

« Nous avons appris que la version bêta de ChatGPT Browse peut parfois afficher du contenu d’une manière que nous ne souhaitons pas », avait déclaré OpenAI sur Twitter, « par exemple, si un utilisateur demande spécifiquement le texte intégral d’un URL, le système peut répondre à cette demande par inadvertance ». En d’autres termes, un utilisateur ChatGPT Plus pouvait demander au modèle de langage de contourner les paywalls, mais aussi les paramètres de protection de la vie privée, pour obtenir n’importe quel contenu normalement payant.

Face aux inquiétudes des ayants droit, OpenAI a assuré « vouloir faire les choses correctement avec les propriétaires de contenu ». Dans son communiqué, l’entreprise spécialisée dans l’intelligence artificielle (IA) explique avoir désactivé ChatGPT Browse « par excès de prudence, le temps de résoudre le problème ». Le retour de la fonctionnalité devrait se faire « le plus rapidement possible ».

OpenAI veut montrer sa bonne foi

Si OpenAI a pris la parole publiquement pour s’exprimer sur ces dérives, c’est avant tout pour montrer patte blanche. Le géant est accusé par plusieurs plaintifs d’enfreindre la loi relative aux droits d’auteur et à l’utilisation d’informations confidentielles. Deux auteurs ont entamé une procédure judiciaire contre la société, affirmant que leurs romans ont été utilisés pour entraîner le modèle.

Paul Tremblay, derrière La Cabane aux confins du monde, et Mona Awad, autrice de Lapin et 13 Ways of Looking at a Fat Girl, garantissent que ChatGPT est capable de produire « des résumés très précis » de leurs œuvres. Selon eux, une telle prouesse est « réalisable seulement si ChatGPT a été entraîné sur du contenu protégé par le droit d’auteur ». Si les deux écrivains concèdent que le modèle fait quelques fois des erreurs, ils soulignent qu’« à aucun moment ChatGPT n’avait reproduit les informations de gestion des droits d’auteur qu’[ils] avaient jointes à leurs œuvres publiées ».

Pour endiguer ce problème, les régulateurs du monde entier cherchent à encadrer l’intelligence artificielle. En Europe, le Parlement européen a adopté, mi-juin, l’AI Act dont une partie concerne la protection des droits d’auteur. Parallèlement, les médias négocient avec les mastodontes du secteur afin de conclure un accord pour que ces derniers puissent utiliser leurs contenus en échange d’une compensation financière.