On connaissait déjà Google Scholar, l’outil de Google permettant de rechercher des articles et citations issus de la recherche. Dans la même veine, l’entreprise de Mountain View a annoncé le 5 septembre 2018 le lancement de Dataset Search, un moteur de recherche spécifiques aux données scientifiques.
Pour l’instant disponible en version bêta, le moteur de recherche s’adresse aux scientifiques, aux journalistes et à n’importe quelle personne en quête d’indications. L’outil permet de répondre à des requêtes parmi « des milliers de bases de données sur le web », note la chercheuse scientifique Natasha Noy (Google AI) dans une publication de blog.
Une norme commune pour plus de clarté
Lorsque vous effectuez une recherche dans Dataset Search, l’outil affiche une page de résultats permettant d’identifier l’origine des données présentées, « qu’il s’agisse du site éditeur, d’une bibliothèque numérique ou d’une page web personnelle ».
Google a adressé ses directives à ces différents fournisseurs, afin qu’ils donnent les mêmes informations : le nom du fournisseur de la base de données, la date de sa publication, la manière dont elles ont été collectées, et les éventuelles publications qui les mobilisent. Le moteur de recherche utilise le schéma de micro-données schema.org et invite les fournisseurs à « adopter cette norme commune ».
La version actuelle de Dataset Search contient plusieurs ensemble de données en sciences sociales et environnementales. Le moteur de recherche permet aussi d’accéder à des informations gouvernementales ou récoltées par des entreprises de presse. Vous pouvez par exemple y trouver des résultats issus de la Nasa, ou de ProPublica.
Google invite les fournisseurs de données à s’adapter au standard schéma.org afin de diversifier les thèmes des requêtes entrées dans son moteur de recherche. Il est également possible de faire des retours auprès de Google au sujet du développement de son moteur de recherche juste ici.
Google va-t-il ouvrir ses propres données sur la manière dont les gens cherchent des informations ?
Comme le souligne Jeni Tennison, CEO de la fondation Open Data Institute, auprès de The Verge, l’initiative de Google présente l’avantage de regrouper des éléments scientifiques souvent épars et difficiles d’accès. Il pourrait être intéressant que Google profite de ce projet pour faire aussi preuve de transparence sur les informations récoltés via le moteur de recherche. « Si nous voulons comprendre comment les gens recherchent des données et les rendent plus accessibles, il serait bien que Google ouvre ses propres données à ce sujet », suggère-t-elle.
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.
Abonnez-vous à Numerama sur Google News pour ne manquer aucune info !