La donnée est aujourd’hui l’élément essentiel de toute entreprise, mais également des projets de machine learning. Les données sont cependant souvent éparpillées, et il est difficile pour les data scientist, développeurs ou encore ingénieurs de trouver les bonnes données.

Bifrost Data Search est une initiative dont l’objectif est d’agréger, analyser et livre des ensemble de données d’images (datasets) facilement. Il est ainsi possible de réaliser des recherches parmi plus de 2000 datasets, pour facilement alimenter les systèmes de machine learning. Ce projet a été développé par les équipes de Bifrost, un outil souhaitant rendre le développant de l’IA facile et accessible.

Un travail de recherche facilité

 
Bifrost Data Search se présente comme un moteur de recherche, et l’interface utilisateur rappelle légèrement celle de Giphy. Il est possible de faire des recherches par mots clés, mais également par catégories comme Humain, Voitures autonomes, Retail, Drones, 3D, Animaux, Bâtiments, Visages, Intérieur etc.

Il est aussi possible de faire des recherches en fonction du type de tâches voulant être réalisées, à savoir : Segmentation, détection d’objets, classification, Reconstruction 3D… Enfin, Bifrost Data Search, permet également d’effectuer des recherches par classe à savoir : vélos, casques, bateaux, panneaux… Via les filtres proposés, il est aussi possible de définir le nombre minimum d’images disponible dans un ensemble de données.

Pour chaque ensemble de données, il est possible de voir une description de ce dernier, ces attributs à savoir : le nombre d’images, de labels, la taille du dataset, les catégories, les tâches, de se rendre à la source de l’ensemble de données ou bien à la publication.

L’outil est 100% gratuit. Les ensembles de données mis à disposition proviennent tous de plateformes ouvertes !

À l’avenir, l’outil se verra doté de nouvelles fonctionnalités comme une analyse complète de chaque ensemble de données, une amélioration de la recherche, la possibilité de télécharger sur Bifrost Data Search ses propres ensembles de données ou encore de générer des ensembles de données synthétiques.