DeepSeek-V3 : la Chine dévoile son ChatGPT dix fois moins cher

Avec DeepSeek-V3, la Chine a possiblement de quoi inquiéter OpenAI et les grands groupes américains. Son approche open source, sur un secteur de plus en plus dominé par des groupes privés, lui permet d’aller vite, pour beaucoup moins d’argent.

En quelques années, la Chine s’est imposée comme le premier pays en matière d’innovation technologique. Longtemps associé à une image d’assembleur et/ou de copieur, le pays de Huawei et de Xiaomi est aujourd’hui celui qui investit le plus dans la recherche, avec l’espoir de détrôner les États-Unis. En plus des smartphones et des ordinateurs, la Chine est aujourd’hui capable de concevoir ses propres puces et, depuis peu, est leader sur le secteur automobile.

En avance sur l’intelligence artificielle générative grâce à des entreprises comme OpenAI, Google ou Meta, les États-Unis ont longtemps pensé qu’ils maintiendraient leur avance suffisamment longtemps pour tenir la Chine à distance. Deux ans après l’annonce de ChatGPT, la Chine prétend pourtant les avoir détrônés.

DeepSeek : l’usine à modèles chinois

Fondée en 2023, l’entreprise DeepSeek va vite. En moins d’un an, elle a réussi à mettre en ligne plusieurs modèles considérés comme performants, notamment grâce à un très grand effort de financement d’acteurs chinois. DeepSeek travaille à la fois sur des LLM classiques (comme GPT-4o), des LLM entraînés pour des tâches (le code, par exemple) et des modèles d’avant-garde, capables de « réfléchir » (comme o1 ou o3).

Sa dernière prouesse s’appelle DeepSeek-V3 et a été annoncée le 26 décembre 2024. Au programme de ce nouveau modèle :

Une interface 100 % inspirée de celle de ChatGPT, avec des animations très similaires. Il y a même un bouton Search, avec un moteur de recherche intégré.
Une vitesse d’écriture en nette progression (60 tokens/mots par seconde).
Un modèle totalement open source, avec 671 milliards de paramètres (c’est plus que Meta Llama 3.1, le meilleur modèle open source américain).
Un coût d’entraînement estimé à 5,5 millions de dollars, ce que certains estiment à 10 fois moins que chez les Américains, avec 14,8 trillions de tokens analysés pour l’entraînement.
Une API nettement moins chère, qui pourrait inciter de nombreux développeurs à utiliser DeepSeek, s’il est vraiment efficace, plutôt que GPT-4o ou une autre solution américaine.

Sur Twitter, DeepSeek s'exprime comme une entreprise américaine. Le but est de faire de l'ombre à OpenAI et les autres groupes US. — Sur Twitter, DeepSeek s’exprime comme une entreprise américaine. Le but est de faire de l’ombre à OpenAI et les autres groupes US. // Source : X

Selon les benchmarks publiés par DeepSeek, son modèle V3 est comparable à GPT-4o (OpenAI) et à Claude-3.5-Sonnet (Anthropic), les deux LLM les plus populaires aux États-Unis. DeepSeek-V3 s’en sort même mieux avec les maths et le code, tout en excellant naturellement en chinois. Tout cela reste à prouver (les premiers testeurs indiquent que DeepSeek semble parfois s’emmêler les pinceaux), mais c’est néanmoins très prometteur. Surtout pour un coût si faible.

Benchmarks publiés par DeepSeek pour présenter son LLM V3. // Source : DeepSeek

Les États-Unis doivent-ils s’inquiéter de DeepSeek-V3 ?

En quelques mois et avec relativement peu d’argent, les ingénieurs recrutés par la Chine auraient donc réussi à égaler GPT-4o, le modèle par défaut de ChatGPT. Il reste bien sûr de nombreux avantages à OpenAI (multimodalité, mode voix, intégration, génération d’images et de vidéos etc.), mais l’exploit demeure impressionnant. DeepSeek réussit d’autant plus son coup de communication que sa dernière annonce fait réagir aux États-Unis, là où les précédentes n’intéressaient qu’un public très averti. Le patron de Perplexity s’étonne même de la politique américaine contre l’open source, qui ralentirait les chercheurs. Bref, les États-Unis ont mordu à l’hameçon et s’inquiètent de la remontée chinoise.

Autre coup fort : DeepSeek-V3 est déjà accessible gratuitement. Tout le monde peut l’essayer.

Le patron de Perplexity, une entreprise américaine, dénonce la politique des États-Unis vis-à-vis de l'open source. — Le patron de Perplexity, une entreprise américaine, dénonce la politique des États-Unis vis-à-vis de l’open source. // Source : X

En plus des exploits de DeepSeek, qui veut être le ChatGPT chinois, la Chine finance d’autres modèles de pointe. Parmi eux, CogVideoX, HunyuanVideo (Tencent) et Kling pour générer des vidéos ou Qwen chez Alibaba. Tous ont un point commun : l’open source. Une approche différente des États-Unis, qui permet aux chercheurs d’aller plus vite, avec beaucoup plus de données.

Seule inconnue : comment réagiront les États-Unis de Donald Trump, qui est bien conscient de cette concurrence chinoise ? Une guerre technologique comme avec Huawei n’est pas impossible, pour freiner les recherches chinoises.

Toute l'actu tech en un clin d'œil

Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !

Marre des réseaux sociaux ? Rejoignez la communauté Numerama sur WhatsApp !

Tout comprendre à La guerre de l’IA