En matière de reconnaissance faciale et d’intelligence artificielle, difficile d’imaginer une meilleure base de données que les photos utilisées par les nombreux utilisateurs de l’appli de rencontre Tinder. C’est visiblement ce que s’est dit Stuart Colianni, un développeur qui a récupéré 40 000 photos — à répartition égale entre hommes et femmes — des profils Tinder installés dans la région de San Francisco.
Loin de s’arrêter là, le développeur a mis en ligne cet ensemble de photos sur Kaggle, la plateforme en ligne rachetée par Google le mois dernier, où les spécialistes et les passionnés partagent leur savoir et leur travail autour de l’intelligence artificielle. Les utilisateurs pouvaient donc, pendant plusieurs jours, y télécharger « Les gens de Tinder », 6 fichiers zip contenant les photos.
Stuart Colianni, qui ne semble voir aucun problème à un tel vol de données, met par la même occasion en ligne le script qui lui a permis de procéder à cette collecte de photos, en vantant « l’accès quasi-illimité qu’offre Tinder pour créer un ensemble de données faciales ». Il explique ainsi : « J’ai souvent été déçu [par les autres ensembles de données]. Ils ont tendance à être structurellement très stricts, et trop petits. Tinder offre un accès à des milliers de personnes proches de vous. Pourquoi ne pas tirer profit de Tinder pour créer un fichier de données faciales plus conséquent et plus réussi ? »
Tinder a réagi, les fichiers ont été supprimés
Peut-être tout simplement parce qu’il réutilise ce faisant les photos personnelles de milliers d’utilisateurs sans leur consentement et les expose ouvertement au public. Une étudiante de l’université d’État San Jose identifiée par Techcrunch dans ces photos mais qui préfère reste anonyme, trouve cette dérive déplacée : « Je n’aime pas l’idée qu’on utilise mes photos pour des « recherches » pathétiques. » D’autant que l’usage qui est fait des fichiers — référencés sous le nom de « putes » dans les lignes de code du développeur — n’est pas forcément limité au domaine de l’intelligence artificielle, les plus de 300 personnes l’ayant téléchargé pouvant ensuite les utiliser à leur guise.
Techcrunch, qui a pu consulter les fichiers, souligne que l’ensemble n’est pas exempt de défauts importants pour le jeu de données puisqu’on y trouve des photos d’animaux ou de mèmes parmi celles (prédominantes) de visages, qui faussent le travail des IA.
Tinder affirme avoir réagi : « Nous prenons la sécurité et les données personnelles de nos utilisateurs très au sérieux et des outils sont effectifs pour assurer l’intégrité de notre plateforme. Il est important de souligner que Tinder est gratuit, disponible dans plus de 190 pays, et que les photos utilisées sont des photos de profil, accessibles à tous ceux qui swipent sur l’appli. […] Cette personne a violé nos règles d’utilisation et nous prenons les mesures appropriées tout en enquêtant plus en avant. » Le fichier en question n’est en tout cas plus accessible à son adresse d’origine.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.
Abonnez-vous gratuitement à Artificielles, notre newsletter sur l’IA, conçue par des IA, vérifiée par Numerama !