Endgame, une société spécialisée dans la cybersécurité a lancé une base de données open-source appelée EMBER (Endgame Malware Benchmark for Research). Cette dernière permet à tout un chacun d’entraîner son intelligence artificielle à identifier des comportements malveillants de la part d’applications.

Aujourd’hui, nous sommes quotidiennement confrontés à des attaques de ransomwares, malwares, botnets. Dans une grande partie des situations, il est quasiment impossible de s’en protéger en amont. Les attaques sont subies, avant de voir la ou les failles corrigées. Parce qu’il est plus facile d’identifier un chat ou un arbre sur une photo qu’un virus, l’intelligence artificielle a rarement été mise à contribution pour la cybersécurité, car son application est trop complexe. Avec EMBER, tout cela pourrait rapidement changer.

Il s'agit d'une collection de plus d'un million de représentations de fichiers exécutables portables sous Windows, un format dans lequel les logiciels malveillants se cachent souvent. Pour accompagner cette base, les équipes de la société Endgame ont créé une application pour les IA afin qu’elles puissent s’entraîner sur cette base.

EMBER offre des bases solides à des développeurs travaillant dans la cybersécurité et cherchant à élaborer des systèmes automatiques. Ainsi leurs algorithmes seraient en mesure d’identifier quels schémas ou activités peuvent être malveillants et ainsi lancer des actions en conséquence.

Le hic, c’est que cette même base pourrait permettre aux créateurs de virus d’identifier des schémas d’identification et ainsi créer des systèmes encore plus puissants. Un cercle qui serait à la fois vertueux, et vicieux. Hyrum Anderson, directeur technique de la branche data science de Endgame l’a bien compris. Néanmoins, il espère voir émerger plus d’avantages à l’utilisation de cette base que de risques.

La cybercriminalité est aujourd’hui très lucrative, tant sur les détournements pendant les ICO, que sur le déploiement de ransomwares. L’évolution des algorithmes et des intelligences artificielles pour identifier les virus puis protéger les ordinateurs devra donc aller plus vite. C’est un jeu du chat de la souris qui va se mettre en place, mais qui pourrait vivement s’accélérer avec le machine learning. Cela pourrait par ailleurs laisser quelques personnes sur le carreau.