Le moteur de recherche DuckDuckGo, en pointe sur la protection de la vie privée, est accusé de purger son index pour retirer des sites pirates permettant de télécharger illégalement des œuvres.

C’est une controverse qui est apparue à la mi-avril et qui a gagné en visibilité lorsque Torrentfreak, un site dédié au piratage des œuvres et aux échanges en pair à pair (P2P), a braqué ses projecteurs dessus. Le cœur du problème ? DuckDuckGo, le Google de la vie privée, aurait retiré de ses résultats de recherche des sites fréquentés justement par les « pirates ».

Ainsi, des lieux bien connus de celles et ceux qui se tiennent à la marge de l’offre légale, comme The Pirate Bay, 1337x et Fmovies, ne seraient plus accessibles avec une requête sur DuckDuckGo. Idem pour des services de « stream ripping », qui permettent de convertir automatiquement une vidéo musicale sur YouTube pour en faire un fichier son, comme un MP3.

DuckDuckGo, le moteur de recherche qui se veut l’opposé de Google

L’affaire aurait pu passer sous les radars s’il avait été question d’un moteur de recherche de troisième ou quatrième zone, sans aucune visibilité. Mais le fait est que l’affaire touche l’un des principaux rivaux de Google, dont l’audience ne cesse de progresser depuis 2010. Si elle est encore très loin de celle de la firme de Mountain View, elle n’est pas négligeable pour autant : elle frôle les 100 millions de requêtes par jour. C’est considérable.

Surtout, DuckDuckGo a construit son discours et son service comme l’antithèse de Google : on n’exploite pas vos éléments de recherche, on ne vous piste pas, on ne vous enferme pas dans des « bulles ». Au contraire, on respecte la vie privée des internautes. DuckDuckGo n’est pas le seul moteur de recherche sur ce créneau. Il y a aussi Qwant en France.

DuckDuckGo. // Source : Numerama
DuckDuckGo sur mobile. // Source : Numerama

DuckDuckGo s’avère l’un des plus en pointe sur le sujet. Le groupe a lancé des projets variés pour aider les internautes à se protéger sur le net, comme cet outil qui se débarrasse du pistage publicitaire dans les mails, ce radar anti-pistage sur le web ou bien ce navigateur qui vient défier Google Chrome. De fait, DuckDuckGo a acquis une image de marque positive chez une fraction notable des internautes.

Du moins, c’était vrai jusqu’à ces dernières semaines.

La période est aux controverses pour DuckDuckGo

Le moteur de recherche avait déjà traversé une première controverse, dans le cadre de la guerre en Ukraine, autour du déclassement volontaire des sites diffusant de la désinformation russe. Cette politique, décidée par DuckDuckGo, se traduit par une position moins favorable de certains résultats selon les requêtes. Ceux-ci restent indexés, mais moins bien positionnés.

La deuxième est donc celle autour du nettoyage supposé de l’index de DuckDuckGo pour chasser les sites facilitant le piratage de contenus culturels ou qui sont jugés contraires à l’intérêt des titulaires de droits — comme le retrait des sites de stream ripping, une pratique qui soulève des problématiques juridiques et interroge la portée pratique d’un droit comme l’exception pour copie privée.

Cette affaire a pu donner l’impression d’un désalignement entre le discours — montrer le web tel qu’il est, en somme — et les actes de DuckDuckGo. Après tout, Google nettoie son index pour retirer les liens pointant vers des contenus piratés, à la demande des ayants droit, y compris les pages d’accueil comme celle d’YggTorrent, un important site d’échange de liens BitTorrent.

The Pirate Bay
Une page d’accueil que vous connaissez peut-être, si vous utilisez BitTorrent. // Source : Capture d’écran

Pour se défendre, le fondateur de DuckDuckGo, Gabriel Weinberg, a tenu à réagir le 17 avril sur Twitter. L’intéressé a apporté des éléments pour éclairer la situation. Il confirme qu’il y a un problème dans le fonctionnement du moteur, mais seulement sur l’utilisation des opérateurs avancés de recherche, qui servent à écrire des requêtes un peu plus ciblées et complexes.

« Nous ne ‘purgeons’ pas YouTube-dl ou The Pirate Bay et ces deux sites ont toujours été disponibles dans nos résultats si vous les recherchez par leur nom (ce que la plupart des gens font). Notre site : opérateur (que presque personne n’utilise) a des problèmes que nous examinons », a écrit Gabriel Weinberg. C’est ce qu’a aussi indiqué une porte-parole à The Verge.

https://twitter.com/yegg/status/1515636218691739653

Les opérateurs avancés de recherche sont des instructions que l’on entre dans un moteur de recherche pour affiner une requête. D’ailleurs, Google s’en sert aussi pour aider les internautes à chercher plus efficacement sur le net. Par exemple, au lieu de taper « numerama svod » dans le champ de saisie, on peut taper une autre demande, de type « site:numerama.com svod ».

Ce faisant, on demande à un moteur de recherche de ne pas retourner tous les résultats du net dans lesquels les mots « numerama » et « svod » apparaissent, mais seulement ceux publiés sur numerama.com avec le mot-clé « svod ».

Un bug sur les recherches avancées, pas sur les recherches normales

C’est ce qui s’est passé avec DuckDuckGo : les requêtes normales vers ces sites fonctionnaient, mais pas l’utilisation de certains opérateurs avancés comme « site: ».

L’emploi de cette instruction, qui permet en l’espèce de savoir si un film, un jeu ou n’importe quel contenu est disponible dans une version pirate (par exemple : « site:thepiratebay.org spider-man no way home »), ne renvoyait aucun résultat, ce qui a pu donner l’impression que tel ou tel site n’était plus pris en charge et qu’il y avait donc eu purge de l’index.

Les sites litigieux s’avèrent tout à fait accessibles avec une requête normale sur DuckDuckGo, selon nos constatations, soit en tapant le nom du site, soit l’adresse. C’est vrai pour The Pirate Bay, YouTube-DL, 1337x et d’autres. En revanche, l’usage de l’opérateur avancé est toujours manifestement dysfonctionnel : il ne donne rien de notre côté.

Gabriel Weiner // Source : DuckDuckGo
Gabriel Weinberg. // Source : DuckDuckGo

Les opérateurs avancés de recherche sont des outils qui sont peu connus et peu utilisés par les internautes. La grande majorité du public utilise plutôt un ou plusieurs mots-clés, mais aussi des phrases, sans se douter qu’il existe des astuces pour être plus efficace. On peut filtrer par date, exclure des pages avec des mots-clés précis, chercher dans l’URL ou un type de fichier, etc.

« Nous ne sommes pas et n’avons jamais été la propriété de Google, et nous ne nous appuyons pas non plus sur les résultats de Google pour nos résultats de recherche. Nous sommes une entreprise indépendante depuis notre création en 2008 », a également souligné Gabriel Weinberg. Si jamais Google purge ses résultats pour une raison ou pour une autre, DuckDuckGo ne sera pas affecté.

Il y a toutefois un cas de figure dans lequel les résultats de DuckDuckGo pourraient être affectés, de manière indirecte : le service a évidemment son propre outil pour parcourir le web (ce qu’on appelle un « crawler ») afin de voir les pages qui existent et vérifier si elles ont été mises à jour et comment. Mais DuckDuckGo dépend aussi de sources tierces.

« DuckDuckGo obtient ses résultats à partir de plus de quatre cents sources », est-il ainsi expliqué. Cela peut être Wikipédia, le crawler de DuckDuckGo, mais aussi d’autres moteurs de recherche. Ainsi, si DuckDuckGo ne fait pas appel à Google, il s’appuie par contre sur Bing. Et Bing lui aussi modifie son index pour enlever les sites pirates. Et cela peut parfois se répercuter sur DuckDuckGo, de manière involontaire.

Découvrez les bonus

+ rapide, + pratique, + exclusif

Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.

Découvrez les nombreux avantages de Numerama+.

S'abonner à Numerama+

Vous avez lu 0 articles sur Numerama ce mois-ci

Il y a une bonne raison de ne pas s'abonner à

Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.

Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :

  • 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
  • 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
  • 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.

Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.

S'abonner à Numerama+

Si vous avez aimé cet article, vous aimerez les suivants : ne les manquez pas en vous abonnant à Numerama sur Google News.