OpenAI, un des géants de l’intelligence artificielle (IA), a annoncé le 3 novembre 2022, une nouveauté majeure pour son outil DALL-E 2. Désormais, les personnes et les entreprises qui le souhaitent pourront exploiter le générateur d’images à partir d’une interface de programmation (API). Une évolution significative qui s’ajoute aux autres fonctionnalités qu’a pu proposer OpenAI pour améliorer son outil.

Jusqu’à présent, DALL-E 2 était disponible en tant que service commercial autonome

DALL-E 2 est un générateur d’images, version améliorée de DALL-E, qui exploite l’intelligence artificielle afin de pouvoir agrandir une image que lui fournit un utilisateur. Celui-ci va, à l’aide d’un texte descriptif, proposer une amélioration de l’image en fonction de ses désirs. L’outil va traiter le langage naturel grâce à son modèle NLP GPT-3 et générer une image agrandie de l’image d’origine. Il peut également générer une image à partir de rien, uniquement à l’aide de la description fournie par le client.

La jeune fille à la perle de Veermer, agrandie par OpenAI.

Dans cet exemple, le célèbre tableau de Vermeer, La jeune fille à la perle, a été agrandi afin de la placer dans un environnement ressemblant à une cuisine du XVIIe ou du XVIIIe siècle. Image : OpenAI.

En juillet 2022, OpenAI lance la phase bêta pour DALL-E 2 et une liste d’attente conséquente se forme. Si initialement, seules 100 000 personnes avaient accès au générateur d’images, plus d’un million de personnes attendent de pouvoir s’en servir. Fort de son succès, l’entreprise décide de mettre fin à la liste d’attente, et voit son outil être à l’origine de la génération de plus de deux millions d’images par jour.

Pour y avoir accès, les utilisateurs devaient passer par le service commercial mis en place par OpenAI. Il était alors possible de générer une certaine quantité d’images gratuitement dans le mois, puis de payer un pack additionnel rajoutant une bonne centaine de crédits au compte d’un utilisateur, moyennant un paiement de 15 dollars. Mais la société à l’origine de DALL-E 2 a décidé de changer progressivement de modèle économique et commercial.

DALL-E 2 désormais disponible sous la forme d’une API

Dans un billet de blog, OpenAI a annoncé le lancement de la version bêta de DALL-E 2 sous la forme d’une API. Grâce à cela, il sera possible aux indépendants et aux entreprises qui le souhaitent, d’intégrer l’outil à leurs produits. Rien ne change dans le fonctionnement de DALL-E 2 avec API : les utilisateurs pourront toujours générer leurs images à volonté.

Afin de pouvoir avoir accès à DALL-E 2 sous la forme d’une interface de programmation, il faudra s’inscrire sur une page dédiée puis créer une clé d’accès qui permettra à l’utilisateur d’être le seul bénéficiaire de l’API. Ils pourront ensuite générer des images dans diverses résolutions. Pour des productions en 1024×1024, ils devront débourser 0,02 $, pour des rendus en 512×512, 0,018 $, et pour des images en 256×256, cela coûtera 0,016 $. Avec l’arrivée de cette API, OpenAI ne se base plus sur son modèle de pack pour obtenir des crédits, mais facturera ses clients à chaque génération d’image.

Outre cette arrivée, OpenAI collabore avec plusieurs entreprises afin de leur proposer DALL-E 2. Ainsi, l’outil devrait être accessible sur Shutterstock, une banque d’images, afin que ses habitués puissent générer de nouvelles images à partir des ressources du site. De la même manière, Microsoft a également intégré le générateur d’images dans sa nouvelle application de conception graphique, Microsoft Designer.