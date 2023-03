L’immense succès de ChatGPT, accessible au grand public depuis novembre 2022, a créé une forte attente pour l’arrivée annoncée de son successeur, GPT-4. OpenAI l’a dévoilé le 14 mars après deux ans de travail. Plus fiable, plus créatif et maniable que la version précédente, GPT-3.5, selon l’entreprise, il a aussi ses limites.

Dans la présentation de GPT-4, OpenAI rapporte que son modèle, « bien que moins capable que les humains dans de nombreux scénarios du monde réel, il présente des performances de niveau humain sur diverses références professionnelles et académiques ». L’illustration la plus impressionnante donnée par la start-up est l’examen du barreau américain. En simulant le concours, GPT-4 se classe parmi les 10 % des meilleurs résultats, contre les 10 % les plus faibles pour GPT-3.5.

Les performances du modèle, formé sur les supercalculateurs de Microsoft Azure AI, ont été illustrées au travers de trois exemples de fonction. Selon OpenAI il est capable de générer des tâches d’écriture créative, chansons, scénario, et peut aussi traiter des sujets plus complexes en acceptant des instructions d’environ 25 000 mots. Multimodal, il accepte également les images que les utilisateurs pourraient lui soumettre. Il est capable de les légender, analyser… La start-up donne l’exemple d’une photo de divers aliments de base, avec comme simple question les possibilités de recettes à réaliser à partir de ces produits. Il serait enfin capable d’adopter un style particulier, là où son prédécesseur conservait son ton propre.

Dans l’annonce présentant GPT-4 Sam Altman, président d’OpenAI, a surtout insisté sur les limitations du modèle. Une prudence qui transpire à travers la plupart des documents publiés par l’entreprise : non, GPT-4 n’est pas parfait.

here is GPT-4, our most capable and aligned model yet. it is available today in our API (with a waitlist) and in ChatGPT+.https://t.co/2ZFC36xqAJ

it is still flawed, still limited, and it still seems more impressive on first use than it does after you spend more time with it.

— Sam Altman (@sama) March 14, 2023