Au Kenya, les ballons Loon de Google sont désormais pilotés par une intelligence artificielle basée sur l’apprentissage par renforcement profond. Il s’agit de la toute première fois qu’un tel dispositif est utilisé dans un système aérospatial, affirme dans un billet de blog Salvatore Candido, directeur de la technologie de Loon.

Une IA qui apprend de ses erreurs

Le projet Loon, développé par une filiale d’Alphabet et créé en 2005, vise à apporter Internet dans des zones rurales et reculées dans le monde entier. Pour y parvenir, la firme déploie d’immenses ballons dans la stratosphère, et le Kenya est le premier pays à bénéficier des services du géant de la tech. Si les ballons fournissant un réseau dans le pays africain étaient jusqu’alors pourvus d’un système de pilotage s’appuyant sur des algorithmes automatiques conçus par des humains, c’est désormais une IA qui s’en charge.

Dans une étude publiée dans la revue Nature, les chercheurs expliquent comment ils ont mis au point un ensemble d’algorithmes à la fois écrits et exécutés par un système de contrôle de vol basé sur l’apprentissage par renforcement profond. Cette méthode est notamment celle qui a été utilisée par Google AI pour battre des humains au jeu de Go ainsi qu’à Dota 2, et permet aux logiciels de s’enseigner eux-mêmes des compétences en apprenant de leurs propres erreurs. Selon Salvatore Candido, le système de pilotage est bien plus performant que ce que lui et son équipe avaient espéré, puisqu’il s’est avéré meilleur que le précédent :

« Dans l’ensemble, le système d’apprentissage par renforcement a permis de garder les ballons à portée de l’endroit souhaité plus souvent tout en utilisant moins d’énergie. De toute évidence, plus le ballon peut rester près d’un endroit défini, mieux c’est, car cela permet de fournir un service plus stable aux personnes qui s’y trouvent. La consommation d’énergie est cependant presque aussi importante. Le système Loon est alimenté par l’énergie solaire et l’énergie collectée est une denrée précieuse. Non seulement il alimente la navigation, mais il alimente également les équipements de communication pour le trajet et la destination du déplacement. En utilisant moins d’énergie pour diriger le ballon, on dispose de plus de puissance pour connecter les gens à Internet, à l’information et à d’autres personnes ».

Plus performante que les humains

Avant de déployer le système, les chercheurs l’ont entraîné sur un simulateur de vol avec l’aide de l’équipe chargée de Google AI à Montréal. Il a ainsi pu apprendre de lui-même dans des conditions virtuelles avant d’être testé en conditions réelles au Pérou. C’est à ce moment qu’il a été plus performant que celui mis au point par des humains et baptisé StationSeeker, notamment en restant constamment à proximité d’un appareil utilisé par l’équipe dans le but de mesurer les signaux LTE sur le terrain.

Désormais, l’équipe estime que le système est « une preuve que l’apprentissage par renforcement peut être utile pour contrôler des systèmes complexes dans le monde réel pour une activité fondamentalement continue et dynamique », et elle espère qu’il sera appliqué à d’autres dispositifs similaires à Loon.