Google et l'université de Stanford travaillent sur un algorithme capable de décrire le contenu d'une image, en identifiant les principaux éléments apparaissant sur le cliché avant de déterminer la relation qu'ils peuvent avoir entre eux. Si le système est loin d'être parfait, il donne des résultats tout à fait satisfaisants.

Jusqu'à présent, on connaissait les outils de reconnaissance faciale qui permettent de repérer et d'identifier les visages apparaissant sur une photo. Ce type de technologie est par exemple très prisé par les réseaux sociaux comme Facebook. Ce dernier s'en sert en particulier pour suggérer à ses utilisateurs de marquer leurs proches lorsqu'ils envoient des clichés dans lesquels ces derniers apparaissent.

Mais il y a beaucoup plus impressionnant : ce sont les outils qui sont capables d'analyser le contenu d'une photographie et d'en faire une description très fidèle. Et justement, Google est sur le coup – en partenariat avec l'université de Stanford – avec une solution qui est non seulement capable de détecter les éléments d'un cliché, mais aussi de déterminer les relations qu'ils ont entre eux.

Le résultat est saisissant. Sur les quelques exemples donnés par la faculté américaine, la description est vraiment précise. Mais des erreurs peuvent parfois apparaître. La firme de Mountain View a ainsi présenté des clichés qui ont été classés en fonction de la précision de la description. Certaines sont par exemple très bien présentées, tandis que d'autres sont complétement hors sujet.

Cette reconnaissance picturale implique plusieurs technologies, allant de l'apprentissage automatique (machine learning) à la vision par ordinateur (computer vision), ainsi que le traitement automatique du langage naturel (natural language processing) et la traduction automatique (machine translation).

Dans le détail, le système essaie d'associer des images à des phrases. Chaque image est analysée et ses principales composantes sont repérées. Ces dernières sont ensuite associées à des mots et l'outil essaie alors de construire une phrase cohérente en rapport avec le cliché.

Un tel logiciel pourra être utile à Google dans son moteur de recherche. Si cet algorithme est intégré dans les entrailles du moteur, les utilisateurs pourront être en mesure de décrire une image de façon relativement précise et espérer obtenir une page présentant des résultats satisfaisants.

Découvrez les bonus

+ rapide, + pratique, + exclusif

Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.

Découvrez les nombreux avantages de Numerama+.

S'abonner à Numerama+

Vous avez lu 0 articles sur Numerama ce mois-ci

Il y a une bonne raison de ne pas s'abonner à

Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.

Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :

  • 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
  • 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
  • 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.

Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.

S'abonner à Numerama+

Vous voulez tout savoir sur la mobilité de demain, des voitures électriques aux VAE ? Abonnez-vous dès maintenant à notre newsletter Watt Else !