Phénomène du début d’année 2025 avec son modèle de réflexion R1, l’entreprise chinoise DeepSeek vient de publier DeepSeek-V3-0324. Ce nouveau LLM open source concurrence GPT-4o et GPT-4.5. Avec 685 milliards de paramètres, il pourrait s’imposer comme une nouvelle offensive de la Chine sur l’intelligence artificielle.

DeepSeek est de retour ! La pépite chinoise de l’intelligence artificielle, qui a réussi à elle seule à provoquer un effondrement boursier aux États-Unis, s’était illustrée en début d’année grâce à ses modèles de langage capables de rivaliser avec les LLM des américains, mais avec des coûts d’utilisation nettement inférieurs. DeepSeek-R1, son modèle de réflexion, coûtait 27 fois moins cher par question que o1 (ChatGPT). De quoi remettre en question les dépenses de Google ou OpenAI. Autre avantage : R1 est open source. De nombreuses entreprises, notamment américaines, ont récupéré le modèle pour développer leurs propres services.

Avant R1, DeepSeek avait déjà impressionné la communauté de l’IA avec V3, un LLM plus classique qui rivalise avec GPT-4o ou Google Gemini. L’entreprise l’a mis à jour ce 24 mars 2025, sans aucune communication.

Surprise, il y a un nouveau DeepSeek-V3

En attendant DeepSeek-R2, que les rumeurs annoncent comme susceptible de surpasser OpenAI o3 (le créateur de ChatGPT accuse DeepSeek d’avoir volé sa propriété intellectuelle), l’entreprise chinoise a publié une révision de son LLM classique, DeepSeek-V3. Son nom : DeepSeek-V3-0324, ce qui fait référence à sa date de publication.

Le modèle peut d’ores et déjà être téléchargé depuis Hugging Face et nécessite une machine très puissante. Il pèse au total approximativement 700 Go et utilise l’architecture MoE (Mixture-of-Experts) pour ne pas tout charger d’un coup, ce qui lui permet de fonctionner sur des machines puissantes, mais disponible sur le marché. Le dernier Mac Studio d’Apple fait partie des candidats.

Le nouveau modèle de DeepSeek sur Hugging Face.
Le nouveau modèle de DeepSeek sur Hugging Face. // Source : Numerama

Quoi de neuf dans cette nouvelle version ? La fiche technique du modèle est vide. DeepSeek joue sur l’effet de surprise, un peu comme Mistral, pour faire parler de lui. On sait juste que DeepSeek-V3-0324 est un LLM avec 685 milliards de paramètres, ce qui en fait un gros bébé (le premier DeepSeek-V3 avait 671 milliards paramètres). Son coût d’utilisation est probablement le même que dans la version lancée en décembre 2024 : son entraînement était estimé comme 10 fois moins coûteux que celui de GPT-4o.

Lancer des versions révisées d’un LLM est assez courant dans l’industrie. Les premiers testeurs parlent de « changements plus grands qu’attendus », avec un modèle bien meilleur en maths. N’importe qui peut installer V3-0324 dès maintenant, en attendant une communication officielle de DeepSeek, pour détailler les changements. Pour l’instant, il reste difficile de présenter le nouveau V3 comme une rupture majeure. La Chine reste néanmoins l’adversaire le plus redoutable des États-Unis, avec une version ouverte qui profite à toute l’industrie.

Découvrez les bonus

+ rapide, + pratique, + exclusif

Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.

Découvrez les nombreux avantages de Numerama+.

S'abonner à Numerama+

Vous avez lu 0 articles sur Numerama ce mois-ci

Il y a une bonne raison de ne pas s'abonner à

Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.

Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :

  • 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
  • 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
  • 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.

Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.

S'abonner à Numerama+
Toute l'actu tech en un clien d'oeil

Toute l'actu tech en un clin d'œil

Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !


Marre des réseaux sociaux ? Rejoignez la communauté Numerama sur WhatsApp !