Récemment, le Massachusetts Institute of Technology (MIT) expliquait qu’il souhaitait augmenter ses robots en leur apprenant à apprendre. C’est précisément ce qu’a réussi à faire NVIDIA. Désormais, les chercheurs n’ont plus à ajuster les robots au fur et à mesure des expériences réalisées. Chacun d’entre eux est capable d’apprendre de ses erreurs et de recommencer pour mieux faire. La robotique fait donc un pas de géant vers l’autonomie.

Logiquement, avant chaque nouvelle utilisation, un robot doit être reprogrammé pour que son circuit informatique soit au courant de la mission qui l’attend. Désormais, ils sont programmés pour apprendre par eux-mêmes. Contrairement à ce qu’on pourrait penser, cette nouvelle méthode risque d’être légèrement plus longue que la méthode classique, pour donner des résultats probants. Cependant l’intervention humaine devient obsolète, et c’est là, la réelle prouesse.

Dans les nouveaux laboratoires de NVIDIA, à Seattle, une équipe de chercheurs s’attèle à mettre en place cette nouvelle méthode d’apprentissage. Pieter Abbeel, chercheur à l’Université de Berkeley précise que : « pour tous ceux qui font de la recherche en simulation vers la réalité, cette nouvelle méthode devrait être un gain de temps considérable. Nous repensons totalement l’approche, vous gagnerez du temps pour observer et pour rédiger ».

Comme l’expliquait Russ Tedrake, professeur au MIT : « l’objectif de nos recherches est aussi de permettre aux robots de comprendre un peu mieux leur environnement – l’emplacement de quelques points clés. Cela est suffisant pour permettre un large éventail de tâches et de manipulation utiles aux robots ».

De son côté, l’équipe de recherche NVIDIA en est convaincue : une fois que l’ensemble des paramètres seront parfaitement définis, le processus d’apprentissage du robot pourra être totalement laissé de côté du début à la fin de l’expérimentation. Une technique moins rapide mais tout aussi efficace que celle qui nécessitait l’intervention humaine. L’idée derrière cette petite révolution, est de profiter de ce temps gagné pour pouvoir multiplier le nombre d’expériences et donc de tester de nouveaux robots, sur un plus grand nombre de tâches.