OpenAI a annoncé le lancement de DALL-E 3, la nouvelle itération de son intelligence artificielle (IA) génératrice d’images. Pour la première fois, cette version va s’intégrer avec ChatGPT.

Fusion avec ChatGPT (mais il faut payer)

Permettant de générer des œuvres visuelles à partir d’une simple requête écrite, DALL-E est en concurrence directe avec des IA comme Midjourney et Stability AI. Cette fois, OpenAI possède un argument de taille pour mettre en avant son modèle, puisqu’il sera intégré aux offres payantes de ChatGPT, Plus et Entreprise, dès le mois d’octobre.

Cette fonctionnalité devrait grandement faciliter la tâche des utilisateurs : pour être efficace, DALL-E a besoin de prompts longs et détaillés. Il est parfois difficile d’obtenir un résultat similaire à l’idée de départ. Avec cette version, les abonnés à ChatGPT pourront demander à l’IA de rédiger un texte spécifiquement pour DALL-E, et il s’exécutera.

DALL-E 3 produit des images plus convaincantes que ses prédécesseurs, et se montre particulièrement douée pour les images contenant des lettres, des chiffres et des mains humaines, précise OpenAI. « Elle est bien meilleure pour comprendre et représenter ce que l’utilisateur demande », assure Aditya Ramesh, chercheur au sein de l’entreprise. Le modèle parvient également à mieux respecter les consignes dans le moindre détail.

OpenAI insiste sur la sécurité

Les IA génératrices d’images pouvant être exploitées à des fins malveillantes, OpenAI assure avoir tout mis en œuvre pour sécuriser au mieux sa technologie. Elle a collaboré avec une « red team » externe afin de tester sa robustesse. Elle s’est aussi appuyée sur des classificateurs d’entrée, un moyen d’enseigner aux modèles de langage à ignorer certains mots afin d’éviter les messages explicites ou violents. DALL-E 3 ne pourra pas recréer des images de personnalités publiques, à condition que le prompt mentionne spécifiquement un nom.

La firme tient néanmoins à préciser que, comme toutes les IA, le modèle n’est pas parfait et peut commettre des erreurs. Il a en outre été entraîné à refuser de générer des images dans le style d’artistes vivants. D’ailleurs, les créateurs pourront maintenant refuser que leur travail soit utilisé pour former de futurs outils de conversion de texte en image.

Avec cette dernière mesure, OpenAI cherche probablement à éviter de futures actions en justice concernant le droit d’auteur. La société fait l’objet de nombreuses plaintes d’auteurs à cause de son utilisation de texte issu d’Internet pour l’entraînement de ses modèles de langage. La dernière en date compte de grands écrivains américains, dont George R.R. Martin, auteur de la saga A Song of Ice and Fire.

Pour l’heure, OpenAI n’a pas évoqué de date de sortie pour une éventuelle version publique et gratuite de DALL-E 3.