Un étudiant anonyme a développé un inquiétant site internet. Nommé Faces of the Riot, le site repéré par Wired ce 20 janvier 2021 expose plus de 6 000 visages de supposés participants à l’assaut du Capitole, initié par Donald Trump le 6 janvier 2021.
Particulièrement rudimentaire, cette sorte d’annuaire affiche 60 images par page. Sous chacune d’entre elles se trouve un identifiant, celui de la vidéo publiée sur Parler d’où elle est extraite. Si l’on clique sur l’image, cette vidéo s’ouvre : la fonctionnalité a pour objectif de remettre l’image dans son contexte.
Côté texte, la page se contente d’un message d’avertissement, en majuscules : « N’ESSAYEZ PAS DE MENER VOTRE PROPRE ENQUÊTE SUR UNE PERSONNE AFFICHÉE SUR LE SITE. SIGNALEZ-LES AU FBI PAR CE LIEN À LA PLACE. MERCI. »
Ce texte résume à lui seul le dangereux jeu d’équilibriste auquel se livre l’étudiant. Interrogé par Wired, il défend que « toutes les personnes qui ont participé à cet acte violent, qui s’apparente à une insurrection, doivent être tenues responsables ». Il a donc créé un outil pour les exposer, tout en ayant en partie conscience des usages abusifs que permet un tel projet.
Malgré sa volonté de bien faire, l’apprenti développeur s’essaie à un exercice compliqué, alourdi par des approximations techniques et des garanties insuffisantes. Et il fait un exemple malgré lui, les dérives des usages des technologies de détections faciales.
Des données personnelles accessibles publiquement
Pour récupérer les 6 000 visages, l’étudiant a traité les vidéos de l’assaut du Capitole publiées sur Parler, le réseau social repère des pro-Trump. Car oui, les participants de l’invasion, pourtant illégale et punissable par la justice, ont publié plus de 800 vidéos de l’attaque — mais aussi du meeting qui l’a précédé — sur la plateforme. Autrement dit, ils ont eux-mêmes créé une mine d’information truffée de preuves susceptibles de mener à leur arrestation. Et puisqu’ils ne portaient pas de masques malgré le contexte sanitaire, ils sont facilement reconnaissables.
Peu après l’événement historique, Amazon Web Services, l’hébergeur de Parler, a débranché le réseau social. Mais une hackeuse a organisé la sauvegarde en urgence de l’intégralité des plus de 50 To de contenus du réseau social. Pour y parvenir, elle a profité de l’absence de protections élémentaires du site et de l’aide d’une association dédiée à ce genre d’opération de sauvegarde. D’autres, comme l’artiste Kyle McDonald, ont publié un travail de sauvegarde similaire, mais concentré sur les vidéos de la journée du 6 janvier. Les enquêteurs, professionnels comme amateurs, n’ont donc pas eu besoin d’attendre le retour en ligne de Parler pour se pencher sur la reconstitution des événements.
Le créateur de Faces of the Riot fait partie de ceux qui ont récupéré le jeu de données de McDonald. Il a décidé de s’en servir pour tester des outils de détection faciale. Il a donc utilisé un outil pour détecter plus de 200 000 visages sur les 11 heures de vidéos, puis un second pour éliminer les doublons, et n’obtenir que des visages uniques. Sauf que son tri est loin d’être parfait, et le développeur en a conscience : le site compte des doublons, des images de protestants qui n’ont participé qu’à la manifestation en dehors du Capitole, des visages de policiers, ou encore des images… d’objets. Bref, la présence d’une personne dans la base est loin d’être synonyme de participation au vandalisme des lieux. Comme seule modération, le créateur du site propose de le contacter sur Twitter dans le cas où une image ne serait « pas un visage, pas un manifestant, etc… ».
À lui seul, avec l’aide d’un ami, de corriger manuellement la base de données et donc de décider si une personne mérite où non sa place parmi les « émeutiers ».
Avec des garanties techniques insuffisantes, la bonne foi ne suffit pas
Le créateur répète que son initiative vise seulement à appuyer les enquêtes ouvertes des forces de l’ordre, en facilitant l’identification des protagonistes. Mais il ouvre aussi la porte doxing, cette pratique qui consiste à publier des données personnelles dans le but de nuire. Les autorités américaines ont largement les moyens de construire un projet similaire (sans les défauts) si elles le souhaitent, et n’ont vraisemblablement pas besoin de ce genre d’initiative individuelle.
Quand bien même l’exécution du projet serait parfaite, ce n’est pas parce qu’elle vise des émeutiers hors-la-loi qu’elle peut balayer tous les enjeux éthiques (certes moins présents aux États-Unis qu’en France) sur le traitement des images. Si cette fois le projet a un objectif en apparence vertueux, un prochain futur pourrait viser des minorités discriminées, déjà maltraitées par ce genre de technologie. Plusieurs grandes entreprises américaines ont arrêté de recourir aux technologies de reconnaissance faciale en raison des trop nombreuses dérives, ce n’est pas pour que des individus isolés s’octroient le droit de manipuler et d’afficher ces données personnelles.
Le créateur a beau arguer que son site ne comporte pas de moteur de recherche d’image qui permettrait de chercher un visage à partir d’une photo, ce n’est pas une garantie suffisante. Finalement, le projet expose les limites de la détection d’image, et quel genre de projet un développeur débutant peut créer. De quoi inquiéter sur le futur ?
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.
Si vous avez aimé cet article, vous aimerez les suivants : ne les manquez pas en vous abonnant à Numerama sur Google News.