Comment fonctionne le puissant algorithme de TikTok ?

TikTok connaît un succès fulgurant depuis plusieurs années et cela, en raison de trois facteurs principaux. D’abord, il permet une liberté et une facilité de création qu’aucune autre plateforme sociale n’a encore réussi à égaler. Ensuite, il est extrêmement addictif grâce à ses contenus courts qui s’enchaînent les uns après les autres.

Enfin, et c’est très certainement le point le plus important, TikTok possède un algorithme ultra puissant qui permet de cibler avec une incroyable précision les centres d’intérêt de ses usagers. Mais alors, comment fonctionne ce dernier et surtout, comment réussit-il à être aussi précis ? C’est ce qu’a cherché à découvrir le Wall Street Journal au travers d’une enquête publiée ce 21 juillet 2021.

Les éléments déjà présentés par TikTok

Au mois de septembre 2020, TikTok révélait certains détails sur le fonctionnement de son algorithme. Le réseau social expliquait notamment que les interactions (commentaires, likes, abonnements, partages) et la durée de visionnage (completion rates) étaient les deux facteurs principaux qui permettaient à l’algorithme de connaître ses usagers. Il précisait également que d’autres éléments étaient pris en compte, tels que les légendes des publications, les musiques, les hashtags, ou encore la langue, le pays dans lequel se trouve l’utilisateur, ainsi que son type d’appareil.

Si ces informations nous ont permis d’en savoir un peu plus sur l’algorithme de TikTok, elles restaient néanmoins insuffisantes pour le percer entièrement à jour, notamment parce qu’il n’était pas précisé dans quelle mesure chaque facteur pesait dans la balance par rapport à un autre. C’est pourquoi le Wall Street Journal a décidé de mener son enquête en testant en conditions réelles l’algorithme du réseau social.

Le temps de visionnage serait le facteur le plus important

Pour cela, les journalistes en charge de l’enquête ont créé des dizaines de comptes automatisés ayant chacun une personnalité et des centres d’intérêt propres. Tous avaient également une adresse IP distincte qui était assignée à différentes zones géographiques des États-Unis, et leur profil était complété avec leur nom, leur âge, mais pas leur sexe. Notons également qu’à aucun moment, leurs centres d’intérêt n’ont été précisé au sein de l’application.

En arrivant sur TikTok, chaque profil a été confronté à une série de vidéos populaires (en moyenne 6,31 millions de vues) et aux thématiques variées. Au fur est à mesure de la navigation, les contenus proposés étaient de moins en moins populaires (en moyenne 0,78 million), mais de plus en plus précis sur la récurrence d’une thématique en particulier.

D’après les conclusions du WSJ, cela a été rendu possible grâce à un facteur en particulier : le temps de visionnage. Lorsqu’un contenu est visionné entièrement, mis en pause, ou rejoué plusieurs fois, l’application appartenant à ByteDance estime que c’est le signal que celui-ci intéresse tout particulièrement l’utilisateur. Elle se chargera alors de lui proposer des contenus similaires ou assimilés.

Et pour cause… D’après Guillaume Chaslot, data scientist ayant travaillé sur l’algorithme de YouTube et qui milite pour la transparence des algorithmes, TikTok veut avant tout cibler les contenus qui vous font rester sur la plateforme en captant votre attention, et non pas ceux qui ont un impact positif sur vous, ou que vous aimez particulièrement.

L’algorithme de TikTok est une machine de précision

Il faut voir les contenus TikTok comme un arbre gigantesque. Le tronc représenterait les contenus les plus populaires de la plateforme, traitant de sujets qui peuvent toucher plus ou moins tout le monde. C’est à cet endroit que démarrent tous les nouveaux utilisateurs.

Au fur et à mesure, l’algorithme comprend quels contenus captent particulièrement leur attention (notamment grâce au temps de visionnage comme nous l’expliquions précédemment), et va les diriger vers des vidéos aux thématiques de plus en plus précises. Arrivé à un certain stade, l’utilisateur quitte le tronc principal des contenus, pour se diriger vers une branche en particulier, puis vers une feuille.

Imaginons le cas où un utilisateur serait particulièrement sensible aux contenus animaliers. Lorsque l’algorithme le détecte, il lui propose une majorité de vidéos avec des animaux. Puis, il comprend que ce sont les vidéos de chiens qui sont particulièrement intéressantes aux yeux de l’utilisateur, alors il lui propose des contenus présentant majoritairement des canidés. Éventuellement, l’algorithme fini par détecter que l’usager apprécie une race en particulier, les bouledogues français. Alors il lui présentera une majorité de vidéos de bouledogues français.

C’est ainsi qu’en partant de contenus génériques, l’utilisateur fini par retrouver des thématiques extrêmement précises au sein de son fil #PourToi.

Le cas du faux profil Kentucky_96

Dans l’exemple que nous venons de citer, cette précision dans les thématiques ne pose aucun problème majeur. En revanche, dans le cas du faux profil « Kentucky_96 » qui a été créé par le WSJ, l’histoire est toute autre. Celui-ci a été programmé pour être particulièrement attiré par les contenus tristes mettant en avant des états dépressifs. Et rapidement, ces derniers sont devenus légion. À un certain point, ils ont représenté 93% des contenus proposés par TikTok.

Cela pose évidemment un problème majeur pour le bien-être de l’usager qui finit par être uniquement confronté à des contenus ayant le pouvoir d’aggraver son état de santé psychologique. Les mêmes craintes peuvent se poser quand les thématiques proposées sont complotistes et répandent de fausses informations.

Interrogée par le Wall Street Journal, une porte-parole de TikTok a affirmé que les tests menés par le journal n’étaient pas représentatifs de la réalité puisqu’une personne lambda possède plusieurs centres d’intérêt. Elle sous-entend ainsi que les contenus proposés par le réseau social ne traitent jamais exclusivement d’une seule thématique. De son côté, le WSJ affirme que même ses faux profils ayant plusieurs centres d’intérêt, ont invariablement fini par se retrouver confrontés à des vidéos aux thématiques extrêmement précises, sans avoir beaucoup d’opportunités pour en sortir.

Comment fonctionne le puissant algorithme de TikTok ?

Les éléments déjà présentés par TikTok

Le temps de visionnage serait le facteur le plus important

L’algorithme de TikTok est une machine de précision

Le cas du faux profil Kentucky_96

L’intelligence artificielle corrigera les examens de compétences des élèves texans

Les spécialistes de l’IA générative loin d’avoir éradiqué toutes les défaillances de leurs modèles

Derniers préparatifs avant le déploiement de la vidéosurveillance algorithmique

Les associations de défense des libertés numériques en guerre contre les algorithmes de la CAF

La Quadrature du Net dénonce un « algorithme de la honte » utilisé par la CAF

Le projet Nessie, l’algorithme secret d’Amazon pour augmenter ses prix

Comment fonctionne le puissant algorithme de TikTok ?

Les éléments déjà présentés par TikTok

Le temps de visionnage serait le facteur le plus important

L’algorithme de TikTok est une machine de précision

Le cas du faux profil Kentucky_96

L’intelligence artificielle corrigera les examens de compétences des élèves texans

Les spécialistes de l’IA générative loin d’avoir éradiqué toutes les défaillances de leurs modèles

Derniers préparatifs avant le déploiement de la vidéosurveillance algorithmique

Les associations de défense des libertés numériques en guerre contre les algorithmes de la CAF

La Quadrature du Net dénonce un « algorithme de la honte » utilisé par la CAF

Le projet Nessie, l’algorithme secret d’Amazon pour augmenter ses prix

OFFRE EXCEPTIONNELLE