Le Snowflake Summit, grand-messe annuelle de l’entreprise, s’est tenu en juin à Las Vegas, après 3 ans d’absence, covid oblige. Snowflake a profité de l’occasion pour dévoiler les nouveautés à venir pour sa plateforme, et annoncer des performances plus que positives. De quoi l’ancrer encore un peu plus dans un marché qu’elle secoue depuis plusieurs années.

10 années pour ouvrir un marché fermé

Fondée en 2012 aux États-Unis par deux français, Benoit Dageville et Thierry Cruanes, Snowflake propose des solutions de gestion de stockage et d’analyse des données, aussi appelées data warehouse, directement dans le cloud.

Après un démarrage volontairement discret, l’ajout continu de fonctionnalités a rapidement contribué à sa notoriété. Sa neutralité vis-à-vis des fournisseurs de cloud s’est révélée être un argument de taille. Ses clients peuvent choisir, mais aussi multiplier les stockages sur AWS, Google Cloud, Azure… Ils gardent aussi une maîtrise totale de leurs données, Snowflake ne participant qu’à fournir le meilleur outil possible pour les gérer, les traiter et les analyser. « Pour nous tout est question de gouvernance et de sécurité » nous assure Benoit Dageville. « Snowflake est conçu de telle sorte que les données de nos clients ne sont pas visibles par nos employés ».

Depuis 2019, la société développe une marketplace permettant de connecter des partenaires ou même des clients avec d’autres clients pour échanger des données, ou utiliser un outil. Snowflake se félicite d’ailleurs de pouvoir désormais compter sur plus de 1 500 partenaires inscrits sur sa marketplace, 1 350 pour le partage de données, 260 fournisseurs, en croissance de 22% chaque trimestre.

« C’est la beauté du data cloud, » poursuit le co-fondateur de l’entreprise. « C’est un environnement que nous gérons, donc nous sommes en mesure de connecter les fournisseurs et les consommateurs selon leurs propres règles. Peu importe ce que votre fournisseur souhaite exposer [comme données, ndlr], nous le garantissons. »

Annonce après annonce, l’offre de Snowflake est devenue plus complète, proposant un produit universel, simple d’utilisation, collaboratif, fournissant le plus de libertés à ses utilisateurs. Sa marketplace lui permet ensuite de proposer des services pour des contraintes liées à certaines industries, ou simplement pour des besoins bien spécifiques.

Cette approche lui octroie un double positionnement. Universel d’un côté avec sa plateforme, ultra-spécialisé sur telle ou telle industrie à travers sa marketplace. Cet atout lui a permis d’aller gagner des clients dans des secteurs variés allant de la finance au pharmaceutique, en passant par la distribution, ou encore les médias.

Aujourd’hui en concurrence directe avec des services déjà bien en place comme Big Query de Google, Redshift d’AWS, ou d’autres plus récents à l’instar de Databricks, Snowflake gagne, doucement mais sûrement, des parts de marché.

Depuis 3 ans, l’entreprise voit arriver ses clients par centaines. En 2019, elle en comptait 948, lors du Snowflake Summit 2022, elle en a annoncé très exactement 6 322. Les deux tiers sont basés aux États-Unis – où elle a son siège social, suivi par la région EMEA (1 329), puis APAJ (APAC + Japon) (691). La consécration de cette forte croissance a eu lieu en 2020, avec une introduction en Bourse remarquée, et un chiffre d’affaires multiplié par deux entre 2021 et 2022.

Mais Snowflake ne compte pas en rester là, tant elle voit de nouveaux besoins à adresser, et de régions à conquérir. D’ailleurs, « Ce n’est que la fin du début » se targue Frank Slootman, PDG de Snowflake.

Frank Slootman, PDG de Snowflake

Frank Slootman, PDG de Snowflake. Photographie : Valentin Blanchot / Siècle Digital.

Python, tables hybrides, et données transactionnelles en tête du Snowflake Summit

Tour à tour, les responsables de produits de la société se sont relayés sur scène pour présenter les nouveautés à venir. Sur les nombreuses évolutions apportées à Snowflake, deux se démarquent particulièrement.

Tout d’abord, Snowflake a annoncé le support de Python. Ce langage de plus en plus utilisé dans le domaine de la data science rejoint ainsi SQL, Java, et Scala, déjà supportés par le data cloud. Une avancée marquante, qui, même si elle reste pour l’instant en preview publique, semble déjà faire l’unanimité. « C’est la promesse de pouvoir déployer plus facilement, et simplifier les workflows des équipes de data science » nous confie Paolo Terzi, head of data de Swile.

Cette nouveauté en dit long sur les desseins de Snowflake. Désormais langage de référence dans le machine learning, l’ajout de Python ouvre la porte à de nombreux usages complémentaires.

Peu après, Snowflake a annoncé la prise en charge de tables hybrides dans un tout nouveau produit baptisé Unistore. Les entreprises vont enfin pouvoir associer données transactionnelles et des données analytiques. « Unistore et Hybrid Tables permettent aux clients de créer des applications transactionnelles avec la même simplicité et les mêmes performances que celles auxquelles ils sont habitués avec Snowflake, ainsi qu’avec une approche unifiée de la gouvernance et de la sécurité des données » écrit l’entreprise.

Des solutions de cybersécurité et de gestion des coûts, ont également été dévoilées. Elles tendent à répondre à des besoins grandissants d’entreprises toujours plus utilisatrices de Snowflake. 206 entreprises déboursent désormais plus d’un million de dollars par an pour son data cloud (+98% en un an).

Des clients et des usages variés

Novartis accélère la mise sur le marché de ses médicaments

Figurant parmi les plus grands groupes pharmaceutiques du monde, Novartis a lancé il y a quelques années un vaste projet tourné vers l’analyse de la donnée, mais surtout sa collecte et sa gestion. En est ressorti une plateforme globale baptisée Formula One. Elle repose sur une architecture multi-produit, avec les solutions de divers partenaires comme Databricks, Matillion, Qlik, ou encore Snowflake.

« Dans cette plateforme, nous intégrons environ 1 000 sources de données de différents domaines industriels, » nous explique Loïc Giraud, Global Head Digital Delivery de Novartis. Dans ces domaines, on retrouve la recherche et développement, les essais cliniques, mais aussi les données de vente, de logistique, de production, des ressources humaines… « Cela regroupe la quasi-totalité de nos données internes. Nous intégrons aussi des données externes, provenant d’entreprises ou d’universités. » Les géants de la tech ayant fait une incursion dans la recherche médicale, Novartis a également conclu des partenariats avec Microsoft et Amazon fin d’exploiter leurs données.

Conçue pour être simple d’utilisation, cette plateforme est devenue un outil essentiel pour l’entreprise. Elle n’est pas uniquement réservée à ses 2 000 data scientists, 60 000 collaborateurs l’utilisant régulièrement. « Nous voulons avoir moins d’ingénieurs en informatique, et donner plus de flexibilité aux fonctions business, » appuie Loïc Giraud.

Plus concrètement, Formula One a déjà démontré qu’elle permettait d’être plus efficace, notamment dans la mise sur le marché d’un médicament. Ce processus, très strict et compartimenté, demande environ douze ans et coûte « entre un et un milliard et demi » à Novartis. L’ensemble de ses essais cliniques, en moyenne 500 par an, sont suivis sur la plateforme. Y est déterminé quel patient sera mis à contribution, sur quel site, quels sont les risques d’erreurs… Cette approche lui permet « de gagner deux à trois ans entre la découverte de la molécule et sa mise sur le marché », un gain financier énorme à l’échelle de l’entreprise, mais surtout « une révolution pour les patients en attente » conclut Loïc Giraud.

Swile construit une plateforme globale

Le marché français de Snowflake n’est pas encore très développé, mais on retrouve parmi ses clients la licorne Swile. En 2020, la startup a créé son équipe data, et a nommé Paolo Terzi, pour diriger ce nouveau pôle.

Son équipe a d’abord conservé Redshift, déjà en place, le temps de construire l’écosystème de données nécessaire. Dans le même temps, elle s’est confrontée à des problèmes de performances de la solution de data warehouse d’Amazon Web Services. Le rachat d’Okarito quelques mois plus tard a tout changé, « ça nous a confrontés à un besoin de globalité des données, » nous confie Paolo Terzi, head of data de Swile, qui s’était alors fixé pour objectif de créer une plateforme globale.

La fintech a alors amorcé une migration graduelle sur Snowflake, terminée en novembre. Aujourd’hui, leur plateforme est « un point central pour la donnée, qui va ensuite servir les ventes dans Salesforce, les outils marketing, nos clients (…) ».

Believe source de nouveaux artistes

Dans les autres clients tricolores de Snowflake, nous avons aussi rencontré Believe, plus éloignée du secteur de la finance. Fondée en 2004, elle gère la distribution digitale de plus d’un million d’artistes à travers le monde, avec par exemple en France les rappeurs Jul ou PNL. Au-delà des classiques Spotify, Apple Music ou Deezer, elle est connectée à 150 des 180 boutiques virtuelles de musique actuelles, qu’elles soient aux États-Unis, en Inde, en Chine, ou en Amérique latine.

Eux aussi ont placé Snowflake au centre de leur plateforme de traitement de données. Dans un premier temps, Believe intègre ses données internes, comme son catalogue, et dans un second temps, elle va récupérer des données externes. Chaque jour, elle ingère 1,4 milliard de lignes, parmi elles, « beaucoup de données de nos stores, notamment Spotify, Deezer … Donc si vous écoutez Vianney ce soir, demain matin ça sera dans notre tableau » détaille Stéphane Giauque, Data VP Engineering chez Believe. « Ça nous permet de proposer une expérience multi-store à nos artistes, qui peuvent étudier leurs performances d’écoutes. »

En interne, ces données consolidées permettent aux équipes de sourcer des artistes en devenir. « Nous avons aussi une meilleure vision de l’activité de nos artistes, dans certains pays, ce qui nous donne la possibilité de mieux les vendre, et mieux cibler la distribution, » poursuit Stéphane Giauque. « Nous calculons également les effets corrélation entre TikTok et les plateformes. Demain notre objectif de donner aux commerciaux des moyens d’évaluer et d’anticiper les niveaux d’écoutes. »

Pricemoov valide la marketplace

Si certain utilisent Snowflake pour développer leur société, d’autres ont fait le choix de développer leur service directement dans le data cloud. C’est notamment le cas de Pricemoov qui a rejoint le programme Powered by Snowflake en 2019. Créée en 2016, l’entreprise française vend une solution de pilotage des prix à des clients comme Cdiscount, Renault, Shurgard, CMA CGM…

L’outil se veut intelligent, en proposant des stratégies de prix, des recommandations tarifaires et un suivi de la concurrence pour des « retailers qui ne veulent plus toujours avoir les mêmes prix sur tous les canaux », nous dit Nicolas Laloum, strategic alliance director de Pricemoov.

Dans Snowflake, l’entreprise ingère les données de ses clients, « nous recevons plusieurs fois par jour 50go de données de certaines enseignes ». Elle va ensuite les combiner avec celles de la concurrence, et d’autres provenant de fournisseurs, notamment pour avoir des informations sur la météo, le coût des matières premières, le prix du fret… Ses algorithmes vont enfin afficher le prix le plus adapté.

Contrairement à Swile ou Believe, Pricemoov tire profit de la marketplace de Snowflake. Elle lui permet non seulement d’avoir un accès facile à des sources de données, mais aussi de s’assurer de leur qualité et ainsi faire un choix plus rapidement. « Avant, nous pouvions mettre une semaine à sélectionner un fournisseur, puis vérifier la fiabilité de ses données, etc. De plusieurs semaines de processus, nous sommes passés à quelques jours » explique Nicolas Laloum.

Les fonctions de partage de données entre entreprises sur la plateforme sont aussi très appréciées, « ça nous offre des options de collaboration infinies avec d’autres entreprises ». Notamment pour des clients qui utilisent déjà Snowflake, « nous sommes la seule plateforme de pricing à proposer une intégration aussi courte ». Pricemoov en compte 30%, avec une tendance à la hausse très forte.

Quelle suite à cette « fin du début » ?

En France, Snowflake a su conquérir des sociétés d’abord parce qu’elles sont plus jeunes, et donc plus agiles. D’autres clients comme Pernod Ricard, TotalEnergies, Sanofi ou Accor sont arrivées car plus matures dans leur transformation numérique.

La France et l’Europe par extension sont encore des marchés remplis d’opportunités, avec des entreprises à convertir à l’agnosticité de son data cloud. Pour ce faire, l’équipe française est passée de 30 à une centaine de collaborateurs en un an. La sortie de crise sanitaire doit être un moteur de changement, et donc d’un passage à Snowflake.

D’autant que la nouvelle roadmap présentée est alléchante pour beaucoup d’utilisateurs, avec la promesse de pouvoir faire développer de nouveaux cas d’usages, mieux sécuriser leurs données, et maîtriser leurs coûts. Entre partage et monétisation de la donnée, « Snowflake va devenir un endroit incroyable si nous arrivons à construire cet app store de la donnée » glissera Benoit Dageville.

Mais si l’on fait preuve d’esprit critique, laissant de côté le discours officiel, Snowflake a-t-elle des défauts ? D’échanges rapides et discrets avec des clients indiens, américains, français, britanniques… Tous convergent : il est actuellement difficile de trouver mieux. Certains ont un point de vue expéditif, résument que « c’est facile et ça pète pas, par contre c’est plus cher », d’autres sont plus élogieux déclarant qu’ils n’ont « jamais vu une technologie comme ça ».

Ils sont aussi unanimes sur un point : 2019 a été un point déterminant. Il faut dire que depuis, l’entreprise a multiplié par 6 son nombre de clients. Avant cela, elle avait difficilement la préférence de ses cibles face aux acteurs de longue date. De ce fait, nombreux sont ceux qui s’attendent à une consolidation prochaine du marché, « ça ne restera pas comme ça éternellement ». En attendant, Snowflake peu suivre les desseins de son PDG et poursuivre l’écriture de son histoire.