En quelques années, la Chine s’est imposée comme le premier pays en matière d’innovation technologique. Longtemps associé à une image d’assembleur et/ou de copieur, le pays de Huawei et de Xiaomi est aujourd’hui celui qui investit le plus dans la recherche, avec l’espoir de détrôner les États-Unis. En plus des smartphones et des ordinateurs, la Chine est aujourd’hui capable de concevoir ses propres puces et, depuis peu, est leader sur le secteur automobile.
En avance sur l’intelligence artificielle générative grâce à des entreprises comme OpenAI, Google ou Meta, les États-Unis ont longtemps pensé qu’ils maintiendraient leur avance suffisamment longtemps pour tenir la Chine à distance. Deux ans après l’annonce de ChatGPT, la Chine prétend pourtant les avoir détrônés.
DeepSeek : l’usine à modèles chinois
Fondée en 2023, l’entreprise DeepSeek va vite. En moins d’un an, elle a réussi à mettre en ligne plusieurs modèles considérés comme performants, notamment grâce à un très grand effort de financement d’acteurs chinois. DeepSeek travaille à la fois sur des LLM classiques (comme GPT-4o), des LLM entraînés pour des tâches (le code, par exemple) et des modèles d’avant-garde, capables de « réfléchir » (comme o1 ou o3).
Sa dernière prouesse s’appelle DeepSeek-V3 et a été annoncée le 26 décembre 2024. Au programme de ce nouveau modèle :
- Une interface 100 % inspirée de celle de ChatGPT, avec des animations très similaires. Il y a même un bouton Search, avec un moteur de recherche intégré.
- Une vitesse d’écriture en nette progression (60 tokens/mots par seconde).
- Un modèle totalement open source, avec 671 milliards de paramètres (c’est plus que Meta Llama 3.1, le meilleur modèle open source américain).
- Un coût d’entraînement estimé à 5,5 millions de dollars, ce que certains estiment à 10 fois moins que chez les Américains, avec 14,8 trillions de tokens analysés pour l’entraînement.
- Une API nettement moins chère, qui pourrait inciter de nombreux développeurs à utiliser DeepSeek, s’il est vraiment efficace, plutôt que GPT-4o ou une autre solution américaine.
Selon les benchmarks publiés par DeepSeek, son modèle V3 est comparable à GPT-4o (OpenAI) et à Claude-3.5-Sonnet (Anthropic), les deux LLM les plus populaires aux États-Unis. DeepSeek-V3 s’en sort même mieux avec les maths et le code, tout en excellant naturellement en chinois. Tout cela reste à prouver (les premiers testeurs indiquent que DeepSeek semble parfois s’emmêler les pinceaux), mais c’est néanmoins très prometteur. Surtout pour un coût si faible.
Les États-Unis doivent-ils s’inquiéter de DeepSeek-V3 ?
En quelques mois et avec relativement peu d’argent, les ingénieurs recrutés par la Chine auraient donc réussi à égaler GPT-4o, le modèle par défaut de ChatGPT. Il reste bien sûr de nombreux avantages à OpenAI (multimodalité, mode voix, intégration, génération d’images et de vidéos etc.), mais l’exploit demeure impressionnant. DeepSeek réussit d’autant plus son coup de communication que sa dernière annonce fait réagir aux États-Unis, là où les précédentes n’intéressaient qu’un public très averti. Le patron de Perplexity s’étonne même de la politique américaine contre l’open source, qui ralentirait les chercheurs. Bref, les États-Unis ont mordu à l’hameçon et s’inquiètent de la remontée chinoise.
Autre coup fort : DeepSeek-V3 est déjà accessible gratuitement. Tout le monde peut l’essayer.
En plus des exploits de DeepSeek, qui veut être le ChatGPT chinois, la Chine finance d’autres modèles de pointe. Parmi eux, CogVideoX, HunyuanVideo (Tencent) et Kling pour générer des vidéos ou Qwen chez Alibaba. Tous ont un point commun : l’open source. Une approche différente des États-Unis, qui permet aux chercheurs d’aller plus vite, avec beaucoup plus de données.
Seule inconnue : comment réagiront les États-Unis de Donald Trump, qui est bien conscient de cette concurrence chinoise ? Une guerre technologique comme avec Huawei n’est pas impossible, pour freiner les recherches chinoises.
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.
Abonnez-vous à Numerama sur Google News pour ne manquer aucune info !