L’américain Snowflake a dévoilé Arctic, son grand modèle de langage (LLM), lancé en open source, ce 24 avril. Son intelligence artificielle générative réalise des tâches d’entreprise, telles que la génération SQL, le codage et le suivi des benchmarks. Arctic bénéfice de budgets pour les calculs d’entraînement nettement inférieurs à ceux-là concurrence, équivalant à un peu plus de 1,8 million de dollars. « Arctic est plus performant que d’autres modèles open source formé avec un budget de calcul similaire » soutient l’entreprise dans un communiqué.

Le code, mais aussi le poids, du modèle d’IA générative de Snowflake sont disponible en open source, sous une licence Apache. Une utilisation personnelle, mais aussi de recherche ou à des fins commerciales sont ainsi possibles. L’entreprise met également à disposition ses formules de données et analyses de recherche.

Arctic s’appuie sur une architecture de mélange d’experts (MoE), dont les paramètres sont divisés en 128 sous-groupes. Ces derniers traitent uniquement les données d’entrée qui peuvent être traitées efficacement. Autrement dit, seuls certains paramètres du modèle, 17 milliards sur 480 milliards, sont activés lors d’une requête. Ce qui permet de réduire les ressources informatiques et la consommation de l’IA, donc les coûts.

Arctic dépasse quasiment toute la concurrence sur les capacités de suivi de consignes

Grâce à cette technologie, Arctic rivaliserait avec Llama 3 70B et talonnerait Mixtral 8X22B. Snowflake indique que l’évaluation de son IA générative laisse apparaître un score de 65 %, comme le modèle de Meta. Quant à celui de la start-up française, il atteint un score de 70 %. Sur un test de mesure des capacités de suivi de consignes, Arctic obtient un meilleur score que l’ensemble de ses concurrents, à l’exception du dernier modèle Mixtral.

« Notre recherche avec Arctic améliorera considérablement notre capacité à fournir une IA fiable et efficace à nos clients », soutient dans un autre communiqué Sridhar Ramaswamy, le directeur général de Snowflake.

Arctic est disponible depuis les catalogues d’API de Nvidia, Amazon Web Services, Microsoft Azure, Replicate, Hugging Face, Lamini, Perplexity, Together et bien entendu Snowflake Cortex.

Les investissements de l’entreprise dans l’IA se sont récemment intensifiés, avec l’arrivée Sridhar Ramaswamy en février dernier et surtout avec le rachat de Neeva en mai 2023. Avec Arctic, Snowflake témoigne de sa compétitivité face à son concurrent Databricks qui s’est emparé du sujet de l’IA de manière bien plus agressive.

Créée en 2012, Snowflake se présente comme l’hébergeur de plus de 9 400 entreprises dans le monde. Parmi ses clients se trouvent Booking, Asics, HP, Disney Advertising, Paramount, Axa ou Western Union. Une expertise et de grands noms qui certifient une exploitation des données optimisée à travers les différentes solutions de Snowflake, dont son nouveau LLM.