La course à l’intelligence artificielle générative est avant tout une guerre de modèles. À ce jeu, l’entreprise Anthropic vient de marquer des points supplémentaires le 24 février 2025, en présentant une nouvelle version de Sonnet, l’un de ses principaux modèles de langage avec Opus (le plus large) et Haiku (le plus petit).
Sonnet, un modèle de taille intermédiaire, passe désormais en version 3.7 et succède à Sonnet 3.5, qui avait fait ses débuts en juin 2024. Déjà à l’époque, Anthropic clamait sa supériorité face à OpenAI, qui avait dévoilé un mois plutôt GPT-4o, qui était alors son dernier projet et, surtout, le nec-plus-ultra de ce qu’elle pouvait faire à l’époque. Claude 3.5 Sonnet est encore aujourd’hui considéré comme un des meilleurs modèles, notamment pour le code, malgré sa plus faible notoriété.
Claude 3.7 Sonnet dépasse OpenAI o1, o3-mini et DeepSeek R1, selon Anthropic
Huit mois plus tard, rebelote. OpenAI, qui fait figure de mètre-étalon dans l’IA générative en raison de la place considérable qu’occupe ChatGPT sur le marché, a présenté deux nouveaux modèles, OpenAI o1 en décembre 2024, suivi d’OpenAI o3-mini en janvier 2025 — bien qu’il ait été évoqué un mois plutôt.
Sans surprise, le nouveau Sonnet 3.7 d’Anthropic affirme que cette mouture surclasse non seulement l’ancienne version (Sonnet 3.5), mais aussi o1 et o3-mini d’OpenAI, ainsi que le modèle chinois DeepSeek R1, qui a fait sensation en début d’année. Pour le prouver, divers graphiques ont été partagés, présentant les performances des uns et des autres.

Selon Anthropic, leur « modèle le plus intelligent à ce jour », mais surtout le « première modèle de raisonnement hybride sur le marché ». Par hybride, la startup fait référence à la capacité de Claude, son chatbot rival de ChatGPT, de produire soit des réponses pratiquement instantanées, soit de prendre davantage de temps pour « réfléchir » pas à pas.
La tendance récente dans l’IA générative est de développer des modèles qui sont capables de « raisonner », notamment en présentant à l’internaute les étapes qui amènent au résultat final. Plusieurs entreprises comme OpenAI (avec o1 et o3), Grok (avec Grok 3) ou encore DeepSeek (avec R1) se sont engagées dans cette direction dernièrement.
Des services et des produits de plus en plus spécialisés
Le travail d’un modèle d’IA avec raisonnement peut être un peu plus long, mais il peut être utile lorsque le chatbot est confronté à des questions plus complexes qu’à l’accoutumée. Par exemple, le mode de réflexion étendu sur Sonnet 3.7 est, d’après Anthropic, idéal pour les questions relatives aux mathématiques et à la programmation informatique.
C’est d’ailleurs là dessus que la firme met l’accent : « Sonnet 3.7 montre des améliorations vraiment importantes dans l’écriture de code informatique et dans le développement web ». D’ailleurs, il est aussi lancé Claude Code, « un outil de ligne de commande pour le codage agentique », c’est-à-dire pour les agents IA autonomes — Anthropic est un précurseur.
Ces progrès obtenus avec Sonnet 3.7 devraient toutefois être très vite défiés par toute la scène de l’IA générative, dans les semaines à venir. En effet, les avancées que revendiquent telle ou telle startup ne tiennent pas longtemps. Bien vite, un rival dévoilera une mise à jour d’un de ses modèles qui prétendra surclasser Sonnet 3.7. Les rumeurs s’accordent notamment sur le lancement imminent de GPT-4.5, par OpenAI.
Ces percées apparaissent par ailleurs de plus en plus spécialisées, avec des services qui s’adressent à une clientèle plus experte, et non plus au tout venant — on le voit avec les annonces autour de la programmation informatique, des agents autonomes ou des facultés de raisonnement, qui vont de simples questions / réponses générales.
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.
Marre des réseaux sociaux ? Rejoignez la communauté Numerama sur WhatsApp !