Il fut un temps où Google était un moteur de recherche. Aujourd’hui, c’est aussi un moteur de réponse. Et la place laissée pour le reste du web est de plus en plus mince.

C’est une étude qui tombe au plus mauvais moment pour Google. Alors que le congrès des États-Unis va entendre ce 29 juillet les patrons des quatre « GAFA », Google, Apple, Facebook et Amazon, sur leurs comportements en matière de concurrence, le site The Markup révèle les conclusions de son enquête sur la façon dont Google modifie son moteur de recherche à son propre profit, au détriment du reste du web.

Dans cette étude, qui s’intéresse spécifiquement à l’affichage sur mobile (ce qui se justifie par le fait que la consultation via le smartphone est majoritaire depuis quelques années par rapport à une utilisation du PC), The Markup fait observer que 63 % de la place visible sur le « premier écran », c’est-à-dire la zone qui apparaît de base avant le défilement vers le bas pour voir la suite, est accaparé par Google.

« Pour une recherche sur cinq dans notre échantillon, les liens vers des sites web externes n’apparaissaient pas du tout sur le premier écran »

« Nous avons examiné plus de 15 000 requêtes populaires récentes et avons constaté que Google consacrait 41 % de la première page de résultats de recherche sur les appareils mobiles à ses propres contenus et à ce qu’il appelle les ‘réponses directes’, qui sont peuplées d’informations copiées à partir d’autres sources, parfois à leur insu ou sans leur consentement », pointe The Markup.

Et ce taux monte à 63 % lorsque l’on s’intéresse aux 15 premiers pourcents de la page, qui sont équivalents à l’affichage d’un iPhone X.

« Pour une recherche sur cinq dans notre échantillon, les liens vers des sites web externes n’apparaissaient pas du tout sur le premier écran », écrivent les enquêteurs. Or comme sur PC, les premières places sont décisives, car les internautes comme les mobinautes ne vont jamais au-delà des premiers résultats. En fait, la deuxième page des résultats de Google et les suivantes n’existent pas en pratique.

Pour aboutir à ces constats, les deux auteurs de l’étude, Adrianne Jeffries et Leon Yin, ont dû développer 2 « scrapers » spéciaux (des programmes informatiques qui servent à extraire automatiquement des données d’un site web, en l’occurrence Google) 68 analyseurs syntaxiques (« parsers ») pour identifier les éléments sur les pages de résultats de recherche Google.

La méthodologie, très détaillée, a fait l’objet d’une publication séparée.

Pour appuyer leurs observations, les deux auteurs présentent bien sûr une comparaison entre deux captures d’écran d’une même recherche, sur Linux, mais avec vingt ans d’écart. La première, datée de 2000, montre un seul lien sponsorisé, fortement différencié des résultats classiques. La seconde, prise en 2020, montre un agencement bien plus riche et complexe, avec des rubriques alimentées par Google.

Linux 2000 2020

Une recherche Linux en 2000, une autre en 2020. Captures réalisées par The Markup.

Mais surtout, ils ont conçu une animation simulant le défilement d’une requête depuis un mobile, en l’occurrence un iPhone X.

Sur une requête médicale, en l’espèce sur la maladie d’Alzheimer, il faut passer plus de 30 % de la page pour tomber enfin sur un premier résultat qui soit un site web. Tout le haut est accaparé par de la publicité, des informations contextuelles sont issues de sites tiers (par exemple Wikipédia), comme les symptômes ou les traitements, et enfin des questions en rapport que se posent aussi les particuliers.

Une transformation engagée depuis des années

Celles et ceux qui s’intéressent aux pratiques de Google estimeront sans doute que les travaux conduits par The Markup ne révèlent rien de fondamentalement nouveau. On sait en effet depuis 2012 au moins que Google veut se faire de plus en plus moteur de réponse et non plus seulement moteur de recherche. Cela passe, par exemple, par les informations contextuelles, dans le cadre du projet Knowledge Graph.

Ces encarts thématiques sont évidemment pratiques pour l’internaute, puisqu’il a accès à de l’information immédiatement. Tapez « météo » dans Google et vous aurez le temps qu’il fait dans votre ville. Cherchez « bourse Air France » et vous aurez un graphique détaillé du cours de l’action. Inscrivez « paroles Hotel California » et la célèbre chanson des Eagles se dévoilera immédiatement.

Et il ne s’agit-là que de quelques exemples, que l’on peut multiplier à l’envi : « âge François Hollande », « date investiture Macron », « PIB Norvège », « peintre Joconde » et ainsi de suite. Même des requêtes d’un mot suffisent à afficher ces encarts. Bien souvent, Google prend l’introduction d’un article Wikipédia, car le contenu de l’encyclopédie est gratuit. Mais au moins, Google verse de temps à autre une contribution.

Google PIB Norvège

L’essentiel apparaît dans Google.

Cependant, l’enquête de The Markup a un mérite : elle quantifie la tendance qu’a Google à transformer son moteur de recherche à son propre profit, de façon parfois excessive. Une polémique récente en donne une illustration :

En début d’année, Google a tenté de gommer les différences d’affichage entre la publicité et les résultats normaux, au prétexte que cela bénéficierait aux internautes (et pas du tout bien sûr à Google, une entreprise qui tire près de 90 % de son chiffre d’affaires de la publicité). Le projet, évoqué début 2019, a toutefois déclenché une fronde ayant conduit Google à reculer, un peu.

Quand Google a lancé le Knowledge Graph en 2012, il a aussi mis en avant le bénéfice pour l’internaute :  « On ne fournit que quelques éléments essentiels […] Ces données sont une porte d’entrée vers d’autres éléments du web ». Des liens hypertextes sont d’ailleurs là s’il veut approfondir. Une manière de contester les accusations portées à son encontre sur le tarissement de l’audience que cela provoque.

Dans les faits, cet affichage a des conséquences réelles sur l’audience des sites. En guise d’illustration, The Markup prend le cas de figure d’une startup américaine spécialisée dans les voyages dont l’activité économique s’est effondrée quand Google a lancé ses propres services comme Flights, Hôtels et Voyages. Des services qui sont directement intégrés à Google et qui, de fait, incitent par exemple les voyagistes ou les compagnies aériennes à ne plus faire des affaires avec la startup.

« On ne fournit que quelques éléments essentiels »

Sollicité par le site, Google a évidemment défendu sa façon de faire, en expliquant que tout est fait pour le bénéfice de l’internaute, et pas pour lui.

« Fournir des liens de retour d’information, aider les gens à reformuler des requêtes ou à explorer des sujets, et présenter des faits rapides n’est pas conçu pour privilégier Google. Ces fonctionnalités sont fondamentalement dans l’intérêt des utilisateurs, que nous validons par un processus de test rigoureux. Parfois, l’information la plus utile sera un lien vers un autre site web — d’autres fois, ce sera une carte, une liste de restaurants, une vidéo ou une image », a déclaré une porte-parole.

Posture ambivalente de Google

Mais à l’heure où l’activité économique passe et dépend de plus en plus du numérique, et notamment de sa visibilité en ligne, c’est-à-dire sur les moteurs de recherche, le fait de faire gagner quelques précieuses secondes à l’internaute lorsqu’il passe une requête, en lui proposant un condensé d’informations, n’est peut-être plus aussi justifié au regard des dégâts que cela occasionne sur de nombreux business. Car le témoignage de la startup américaine est loin d’être isolé.

En somme, cette enquête remet sur le devant de la scène la position ambivalente de Google, qui est à la fois juge et partie.

Google recherche accueil

Google a une part de marché de plus de 90 % dans la recherche, une situation qui soulève des interrogations sur les pratiques concurrentielles de l’entreprise américaine.

Il est en charge de l’efficacité du moteur de recherche, et de la pertinence des résultats mais il en dépend aussi, puisque ses services y sont référencés (trop bien peut-être, à l’image des accusations portées par Dailymotion, qui estime être défavorisé par rapport à YouTube). Or Google est accusé de longue date de ne pas être loyal envers ses rivaux et le reste du web, que ce soit dans le fonctionnement secret de l’algorithme, ou bien dans la façon dont le moteur de recherche est pensé et désigné.

Or, ce n’est pas anodin lorsque l’on pèse aux alentours de 90 % de la recherche en Europe et aux États-Unis — et même dans le reste du monde.

Il reste maintenant à savoir si le congrès des États-Unis saura se saisir de ce sujet pour interroger Sundar Pichai, le patron de Google. Car ses réponses dépendront des questions et des relances des parlementaires. Car il y a réel enjeu économique, d’autant plus fort aujourd’hui dans ce contexte de crise sanitaire. Une réalité dont l’Amérique commence à prendre conscience. Les appels à démanteler les GAFA par une candidate démocrate en ont été un signe. La tenue de cette audition en est un autre.

Découvrez les bonus

+ rapide, + pratique, + exclusif

Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.

Découvrez les nombreux avantages de Numerama+.

S'abonner à Numerama+

Vous avez lu 0 articles sur Numerama ce mois-ci

Il y a une bonne raison de ne pas s'abonner à

Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.

Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :

  • 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
  • 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
  • 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.

Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.

S'abonner à Numerama+

Abonnez-vous gratuitement à Artificielles, notre newsletter sur l’IA, conçue par des IA, vérifiée par Numerama !