DeepSeek a-t-il triché ? Le groupe chinois prétend avoir construit une intelligence artificielle meilleure que ChatGPT-o1, mais 27 fois moins coûteuse, le tout avec un financement de seulement 5,6 millions de dollars (contre des centaines de millions chez les autres). Les experts de l’IA sont tous impressionnés par DeepSeek-R1, qui répond brillamment à la plupart des questions, détaille ses « réflexions » et semble battre ChatGPT dans de nombreux exercices. Puisque le produit est open source, des services comme Perplexity ou Groq proposent déjà leurs propres versions du modèle, sur des serveurs basés aux États-Unis.
Si l’efficacité de DeepSeek-R1 n’est plus à prouver, la réalité derrière sa conception reste un mystère. Le modèle est bel et bien très peu énergivore (on peut le faire tourner en local sur des ordinateurs puissants), mais personne n’a la preuve que DeepSeek n’a dépensé que quelques millions pour le concevoir. Selon OpenAI, qui s’est entretenu avec le Financial Times le 29 janvier, DeepSeek aurait dissimulé un détail important sur la genèse de ses IA : il aurait utilisé ChatGPT pour automatiser l’entraînement de ses modèles.
DeepSeek : un modèle étudiant de ChatGPT ?
OpenAI accuse DeepSeek d’avoir recouru au principe de « distillation des connaissances ». Concrètement, cela permet à un « modèle enseignant » de transmettre son savoir à un « modèle étudiant ». Une entreprise d’intelligence artificielle peut utiliser la distillation pour entraîner des modèles plus petits, en automatisant un scénario où le modèle étudiant poserait des questions au modèle enseignant, puis imiterait ses réponses. L’idée est de ne pas avoir à recommencer le principe d’apprentissage à chaque fois, en se basant sur ses principaux résultats pour aller plus vite.
Si la distillation n’a rien d’inédite, OpenAI interdit à ses concurrents d’utiliser ses modèles pour créer des répliques de ChatGPT dans ses conditions générales d’utilisation. L’entreprise indique au Financial Times qu’elle a trouvé des preuves d’une distillation massive de ChatGPT en 2024. L’entreprise suspecte DeepSeek d’avoir recouru à son API pour interroger massivement ses modèles, afin d’entraîner DeepSeek-V3 et DeepSeek-R1 à moindres frais. Cette technique expliquerait les faibles coûts de conception de DeepSeek : l’entreprise chinoise se serait lourdement servie des serveurs d’OpenAI.
Du côté de la Maison-Blanche, cette piste semble aussi prendre du sens. David Sacks, que Donald Trump a choisi pour superviser l’IA et les cryptomonnaies, a expliqué à Fox News qu’il était « possible » que DeepSeek ait « aspiré » les données d’OpenAI. « Il existe des preuves substantielles que DeepSeek a distillé les connaissances des modèles d’OpenAI », indique le responsable. Il appelle les entreprises américaines à prendre des mesures concrètes pour empêcher les concurrents de dérober leur savoir.
Si l’hypothèse d’OpenAI se confirme, DeepSeek ne serait pas le premier à miser sur la distillation pour copier illégalement un concurrent. Ses résultats seraient néanmoins nettement supérieurs à la concurrence, notamment grâce à plusieurs innovations dans l’architecture utilisée, qui lui permet de limiter grandement les coûts. Avec ou sans distillation, l’exploit de DeepSeek reste énorme. L’entreprise a provoqué un effondrement boursier aux États-Unis le 27 janvier, mais la plupart des actions ont commencé à rebondir dès le lendemain.
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.
Si vous avez aimé cet article, vous aimerez les suivants : ne les manquez pas en vous abonnant à Numerama sur Google News.