Après avoir lancé DALL-E 2, une intelligence artificielle (IA) de génération d’images, en version bêta à la fin du mois de juillet 2022, OpenAI annonce qu’il est désormais possible de l’utiliser sans passer par la file d’attente. Ses utilisateurs pourront donc l’exploiter de A à Z sans avoir à attendre plusieurs heures ou plusieurs jours.

De GPT-3 à DALL-E 2 en passant par DALL-E

C’est en 2021 qu’OpenAI lance DALL-E, un modèle d’IA permettant de générer une image en fonction d’un texte soumis par un utilisateur. Celui-ci est basé sur le modèle de langage GPT-3, mais au lieu d’exploiter les 175 milliards de paramètres de celui-ci, DALL-E n’en exploite que 12 milliards.

Quelques mois plus tard, en juillet 2022, OpenAI propose DALL-E 2 en version bêta. Cette mise à jour permet de générer des images plus réalistes, plus précises, avec une résolution quatre fois supérieure à ce que proposait DALL-E. En plus de cette nouveauté, OpenAI propose également une nouvelle fonctionnalité qu’elle a ajoutée récemment : l’outpainting.

Lorsqu’une personne utilise DALL-E 2, il a la possibilité d’apporter des modifications aux images générées ou téléchargées en ajoutant une légende supplémentaire en langage naturel. Cela permet d’ajouter ou de supprimer un élément, d’éclairer ou d’assombrir l’image, d’ajouter des reflets, de nouvelles textures, de nouvelles couleurs, etc. Cette fonctionnalité correspond à l’inpainting.

L’outpainting va permettre d’agrandir une image existante en prenant en compte des éléments visuels existants dans l’image (ombre, reflet, texture, couleurs), afin de maintenir le contexte et l’ambiance de l’image. Les utilisateurs pourront sélectionner une zone de 1 024 pixels sur 1 024 pixels où l’image sera étendue, puis rédiger une légende. L’IA s’occupe du reste et vous propose un agrandissement respectant les paramètres de l’image de base.

En plus de l’arrivée de l’outpainting, les gens pourront s’inscrire sans aller dans une file d’attente

Comme le précise OpenAI dans son billet de blog, « plus de 1,5 million d’utilisateurs créent désormais activement plus de 2 millions d’images par jour avec DALL-E : des artistes et directeurs créatifs aux auteurs et architectes, avec environ 100 000 utilisateurs partageant leurs créations et leurs commentaires dans notre communauté Discord ».

Fort de cette réussite, l’organisme a décidé d’abolir la file d’attente avant d’utiliser DALL-E 2. Désormais, il suffit de s’inscrire via le site d’OpenAI puis de payer le droit d’accès au modèle. Pour l’instant, DALL-E 2 n’est pas disponible sous la forme d’une API, d’où la mise en place provisoire d’une liste d’attente permettant de savoir combien de personnes souhaiteraient l’utiliser.

L’amélioration du modèle de génération d’images d’OpenAI lance de nouveaux débats au sein de la communauté. Un premier, éthique, évoque les dérives de l’IA, capable de diffuser ou créer du contenu déplacé et/ou discriminatoire. Le second, concerne l’attribution de la création : est-ce qu’une image ou une œuvre générée par une IA peut-être brevetée. Plus généralement : est-ce qu’une IA peut être considérée comme la créatrice d’une œuvre.

Ces dernières années, un ingénieur informaticien, Stephen Thaler, se bat devant les tribunaux du monde entier pour que son IA possédant une velléité artistique explicite puisse être considérée comme un inventeur.