Les développeurs de Jigsaw, une filiale d’Alphabet, ont collaboré avec la Fondation Wikimedia pour mener une étude concernant le cyberharcèlement mené sur la plateforme de Wikipédia (version anglophone). En analysant 100 000 commentaires publiés entre 2004 et 2015, l’équipe a cherché à développer une base colossale pouvant servir de point de départ afin de créer un système d’avertissement réservé aux modérateurs.
Avec l’apport des services des intelligences artificielles de Crowdflower, les développeurs ont annoté les commentaires offensifs, en les classifiant en trois catégories différentes : les attaques directes (« T’es nul »), les harcèlements contre un tiers (« Bill est nul ») et d’autres postures agressives, comme le fait de citer les attaques d’autrui (« Bill dit qu’Henry est nul »).
L’équipe a alimenté une intelligence artificielle (IA) avec ce genre de données, comme elle l’explique sur Medium : « Pendant les tests, nous avons découvert qu’une IA en apprentissage est plus performante pour prédire si un commentaire est une attaque personnelle comparé au travail combiné de trois « crowd workers » [des professionnels freelance qui travaillent sur des plateformes de crowdsourcing]. »
34 utilisateurs jugés « très malsains »
Sans surprise, les développeurs ont constaté que les commentaires d’anonymes avaient 6 fois plus de chances d’être agressifs que ceux d’utilisateurs enregistrés. En revanche, ce genre de harcèlement représente moins de la moitié des attaques de trolls de la plateforme.
En effet, d’après l’étude, 30 % des comportements agressifs proviennent de contributeurs fréquents de Wikipédia, donc des utilisateurs enregistrés avec des pseudonymes voire avec leur nom et prénom. En 2015, 9% des harcèlements proviennent même de 34 utilisateurs jugés « très malsains ». Les chercheurs font preuve d’optimisme : « On pourrait connaître un progrès significatif rien qu’en modérant un petit nombre de ces trolls. »
Ainsi, l’équipe de Jigsaw lance un appel pour concevoir un nouveau tableau de bord destiné aux modérateurs de Wikipédia, afin qu’ils puissent bien identifier les épisodes de cyberharcèlement et résoudre ces situations déplaisantes. Cependant, il reste beaucoup à faire, car la recherche a démontré que seulement 17,9 % des attaques de trolls sont régulièrement modérés par des bannissements.
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.
Abonnez-vous à Numerama sur Google News pour ne manquer aucune info !