« Nous sommes au moment iPhone de l’IA » a proclamé Jensen Huang, fondateur et PDG de NVIDIA à l’occasion de la conférence GTC le 21 mars, destiné aux développeurs, de l’entreprise. Plusieurs offres ont été présentées pour faciliter l’accès aux IA génératives pour les entreprises.

L’IA générative, la poule aux œufs d’or de NVIDIA

Nvidia s’est imposé, avec ses cartes graphiques, comme l’acteur incontournable du développement de l’intelligence artificielle. En pleine effervescence autour des IA génératives, grâce au ChatGPT d’OpenAI, l’entreprise et son PDG surfent sur cette vague très profitable. Jensen Huang a notamment déclaré, « L’IA générative stimule l’adoption rapide de l’IA et réinvente d’innombrables industries ».

Pour accompagner et profiter de son mouvement, NVIDIA a présenté deux offres complémentaires lors de sa conférence : NVIDIA DGX Cloud et NVIDIA AI Foundations.

La première « donne aux entreprises un accès immédiat à l’infrastructure et aux logiciels nécessaires pour former des modèles avancés pour l’IA générative » explique un communiqué de l’entreprise. Les clients pourront louer mensuellement un supercalculateur d’IA sans avoir à le développer soi-même.

Le supercalculateur est hébergé dans des services de cloud, celui d’Oracle, d’Azure au prochain trimestre et bientôt Google Cloud. Pour y avoir accès, les entreprises devront dépenser 36,99 dollars par mois.

En parallèle, deux autres services, au sein de NVIDIA AI Foundations, vont permettre de développer des modèles à exécuter sur DGX Cloud, NeMo et Picasso.

NeMo permet de créer un grand modèle de langage type ChatGPT. Des modèles sont proposés aux clients, qui peuvent y apporter les modifications adaptées à leurs activités. Ils définissent les domaines d’intérêts, les connaissances et compétences voulues. Le nombre de paramètres est aussi adaptable, de 8 à 530 milliards (GPT 3.5 c’est 175 milliards de paramètres). Il est en accès anticipé.

À côté de NeMo, Picasso. Le nom du peintre est utilisé pour un service cloud destiné à « la création et le déploiement d’applications d’image, de vidéo et de 3D génératives alimentées par l’IA avec des fonctions avancées de texte à image, de texte à vidéo et de texte ». Il sera possible d’utiliser un modèle fourni, Edify, qui a le mérite juridique d’être entraînée avec du contenu sous licence. Il est aussi possible de l’optimiser ou d’exécuter ses propres modèles d’IA générative. Picasso est disponible en avant-première privée.