Le modèle économique de la presse en ligne fondé sur la publicité a certes certains avantages, dont nous parlions vendredi. Mais il a aussi beaucoup d’inconvénients et d’effets pervers dont l’un des plus célèbres et des plus critiqués aujourd’hui est la « recherche du clic », ou « click-bait » , dont certains sites se sont fait une spécialité.
Il existe même désormais des études pseudo-scientifiques pour comprendre quels titres attirent le plus les lecteurs. Les articles les plus partagés sur Buzzfeed seraient ainsi ceux qui proposent aux lecteurs de se comparer avec des personnages de films ou de série TV (par exemple : « quel personnage de Game Of Thrones êtes-vous ? » ), ceux qui fédèrent tout en excluant (type « les choses que seuls les mecs de moins de 30 ans peuvent comprendre » ), ou encore ceux qui conseillent des « choses à faire avant de mourir » . Il existe toute une liste de recettes censées conduire au succès d’audience.
Et désormais, il existe même un robot pour générer tout seul les titres qui assurent la plus grande probabilité de clics. Le développeur Lard Eidnes a ainsi publié sur son blog la méthode et le code source d’un générateur de titres attractifs, qui fonctionne grâce à un réseau neuronal récurrent. En clair, grâce à une intelligence artificielle qui génère des titres à partir de modèles statistiques.
Le principe de base consiste à partir d’un mot au hasard, et de prédire le mot suivant qui a le plus de chances d’attirer des clics, et ainsi de suite, jusqu’à former une phrase à peu près cohérente. Pour ce faire Lars Eidnes a d’abord adapté le script open-source char-rnn qui permet de prédire des mots à partir des premières lettres tapées, pour qu’il puisse prédire des phrases à partir des mots. Puis il a entraîné un réseau neuronal artificiel avec environ 2 millions de titres issus de médias en ligne connus pour leur recherche du « click-bait », dont Buzzfeed, Gawker, Jezebel, Huffington Post, et Upworthy.
Click-o-tron !
Il a fallu quelques jours à un processeur graphique d’une carte GTX980 pour calculer l’ensemble des vecteurs permettant d’établir le modèle statistique. En bout de course, le résultat est étonnamment bon, avec des phrases grammaticalement très cohérentes, qui ont même souvent une logique contextuelle d’ensemble.
Mais il fallait encore améliorer l’ensemble. D’où l’idée du développeur de créer Click-O-Tron, un site internet qui a l’apparence d’un média classique, mais qui est 100 % créé par un robot. Les statistiques de lectures et les votes des internautes sur l’intérêt d’un article permettent de nourrir l’intelligence artificielle pour comprendre les titres qui sont cohérents et ceux qui ne le sont pas, et pour choisir de mettre en avant les articles qui font le plus « vrai » .
Les titres des articles sont générés par l’intelligence artificielle, mais également le contenu des articles lui-même (dont la cohérence est toutefois et heureusement très moyenne), qui est réalisé automatiquement, en partant des mots clés du titre. L’image d’illustration est quant à elle choisie sur Wikipedia, en interrogeant l’encyclopédie collaborative sur les mots du titre et en prenant la première image sous licence libre.
Ainsi au moment où nous écrivons ces lignes, les titres qui font la « Une » de Click-O-Tron sont étonnamment bons, même s’ils ne sont pas parfaits :
- « Une plainte contre Apple prétend qu’Apple a été arrêté pour avoir vendu une nouvelle appli TV »
- « La NSA est sur la bonne voie »
- « Le président français est gay, doit se rend à la Maison Blanche »
- « Le nouveau président est ‘à quelques heures’ de la grossesse royale »
Peut-être qu’un jour les algorithmes et les intelligences artificielles seront à ce point perfectionnées qu’elles sauront prendre des sujets d’actualité chaude, et rédiger de véritables articles agréables à lire, cohérents et riches en informations. De tels robots-journalistes existent déjà et sont parfois utilisés par la presse financière (pour rendre compte de façon mécanique des bilans trimestriels publiés par les entreprises), politique (pour donner les résultats d’élections ou établir des prévisions à partir des sondages) ou sportive (pour rendre compte de résultats de matchs). Mais ils pourraient demain être capables de taches beaucoup plus subtiles.
« Robots contre journalistes : qui gagnera la guerre de l’information ? » , s’était demandé Rue89 l’an dernier. La question reste ouverte.
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.
Marre des réseaux sociaux ? Rejoignez-nous sur WhatsApp !