Le CAPTCHA, vous connaissez ? Il s'agit d'un test invitant le visiteur d'un site web à saisir correctement une suite de caractères présentés à l'écran d'une manière déformée afin de vérifier que celui-ci est bien une personne et non un automate. L'objectif du CAPTCHA est évident : il s'agit de tenir à l'écart les robots informatiques configurés pour effectuer une activité malveillante (comme du spam).
Au début, il n'était pas nécessaire de tordre excessivement les caractères du CAPTCHA pour bloquer la nuisance des automates. Mais avec le progrès technologique, les robots ont montré qu'ils parvenaient à interpréter de plus en plus rapidement les symboles du CAPTCHA. Il a fallu alors complexifier le processus par divers moyens (nouveaux symboles, imbrication, fond dégradé, ajout de "leurres"…).
Évidemment, ce qui devait arriver arriva : certains CAPTCHAS sont indéchiffrables, même pour un humain. Soit parce que la présentation des caractères est illisible, soit parce que des symboles difficilement reproductibles au clavier sont proposés. Une recherche dans une banque d'images permet de constater l'existence de CAPTCHAS inutilisables.
Complexifier le CAPTCHA pour distinguer l'humain de l'automate n'est donc plus la bonne voie à suivre. Il faut opter pour une nouvelle approche qui permette toujours de bloquer les bots informatiques sans pénaliser l'activité des internautes. Et justement, Google affirme avoir une solution. La firme de Mountain View, qui a acheté le système reCAPTCHA en 2009, a écrit un billet de blog pour la présenter.
Selon les explications de Google, "la mise à jour du dispositif implique des techniques avancées d'analyse des risques, en considérant activement l'activité de l'usager avec le CAPTCHA – avant, pendant et après avoir interagi avec". Autrement dit, si reCAPTCHA détecte ce qu'il pense être un humain, il proposera un CAPTCHA facilement déchiffrable. Si c'est un bot, le CAPTCHA sera "considérablement plus difficile" à traiter.
Google ajoute que la mise à jour implique "différentes catégories de CAPTCHA" qui seront utilisées selon le type d'utilisateur. "Cette approche multi-facettes nous permet de déterminer si un utilisateur potentiel est en fait un être humain ou non". Sur la capture d'écran fournie par Google, le CAPTCHA destiné aux humains montre deux nombres qui ne présentent aucune difficulté à la lecture.
Inventé par des chercheurs de l'université Carnegie-Mellon, le système reCAPTCHA a l'intelligence de faire d'une pierre deux coups. En plus de combattre les automates, il sert à améliorer par la même occasion le processus de numérisation de livres, là où échouent les systèmes de reconnaissance optique de caractères (OCR), en transmettant les lettres et les mots qui ne sont pas compris par les logiciels OCR.
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.
Abonnez-vous gratuitement à Artificielles, notre newsletter sur l’IA, conçue par des IA, vérifiée par Numerama !