Peut-on faire quelque chose de simple, drôle et profondément inutile sur une base très rigoureuse et complexe ? Sur Twitter, SelfieBot nous le prouve. En surface, le principe est simplissime : vous envoyez une photographie de face à @deepselfie et il vous attribue une note de « selfiesation ». En gros, il va juger votre selfie pour vous dire à quel point vous vous rapprochez du Selfie, celui avec une majuscule : l’idée, le concept de selfie.
Vous pourriez bien sûr vous arrêter là et comparer votre score avec celui de votre voisin. Ou alors, vous pourriez aller lire le blog d’Andrej Karpathy, l’auteur de ce bot pour voir à quel point il ne s’agit pas d’un simple jouet qui vous attribue un score au hasard. Derrière @deepselfie se cache un convolutional neural network, ou réseau de neurones à convolution en bon français. Ce procédé inventé dans les années 1980 est à la base d’une bonne quantité de projets de machine learning, l’apprentissage autonome d’une machine d’après des paramètres de base.
Pour faire au plus simple, prenons une photo de chat. Le réseau de neurones à convolution va lui appliquer plusieurs filtres qui correspondent à des paramètres (la couleur, la forme, la position de telle ou telle courbe) en oubliant à chaque fois la totalité de la photo. Ce faisant, il va se créer une première idée de ce qu’est un chat. Si vous lui donnez une photo de chat et qu’il vous dit qu’il est à 80 % sûr qu’il s’agit d’un hot-dog, il ne vous reste qu’à le gronder pour qu’il apprenne de son erreur et ajuste ses paramètres.
Pour son ConvNet, petit nom donné au processus, Karpathy a récupéré 5 millions de selfies sur le web, a émincé le premier lot pour le réduire à deux millions et les a divisé en deux groupes : les bons et les mauvais selfies. Comment décider d’un bon ou d’un mauvais selfie ? L’ingénieur a pris en compte l’audience qui avait vu le selfie, puis a ajouté différents paramètres pour pondérer ses résultats (le nombre de likes, le nombre de partages etc.). En ajoutant des paramètres comme la longévité en ligne d’un selfie ou la probabilité qu’il ait été vu, il a réduit sa liste à 100 selfies, 50 définis comme « mauvais » et 50 autres définis comme « bons ». La méthodologie a des failles, mais on ne peut nier les efforts qui ont été fournis pour rendre le résultat le plus juste possible.
Il a ensuite tout simplement donné à manger ces deux listes à son ConvNet qui les a prises pour référence avant de passer au crible les 2 millions de selfies collectés précédemment pour affiner ses réglages… pour un total final d’environ 140 millions de paramètres analysés. Serious business. Une fois entraîné à la reconnaissance du selfie parfait, le ConvNet n’avait plus qu’à rendre ses jugements implacables sur Twitter ou participer à de petites expériences amusantes que Karpathy détaille sur son blog.
Oserez-vous soumettre votre portrait au Jugement ?
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.
Abonnez-vous à Numerama sur Google News pour ne manquer aucune info !