OpenAI accuse DeepSeek d'avoir copié illégalement ChatGPT

Les ingénieurs d’OpenAI disent avoir trouvé des preuves que DeepSeek a utilisé la technique de la « distillation des connaissances » pour entraîner son modèle avec ChatGPT. Ses conditions d’utilisation interdisent cette pratique, qui aurait permis au groupe chinois de faire des économies en recopiant les années d’entraînement d’OpenAI.

DeepSeek a-t-il triché ? Le groupe chinois prétend avoir construit une intelligence artificielle meilleure que ChatGPT-o1, mais 27 fois moins coûteuse, le tout avec un financement de seulement 5,6 millions de dollars (contre des centaines de millions chez les autres). Les experts de l’IA sont tous impressionnés par DeepSeek-R1, qui répond brillamment à la plupart des questions, détaille ses « réflexions » et semble battre ChatGPT dans de nombreux exercices. Puisque le produit est open source, des services comme Perplexity ou Groq proposent déjà leurs propres versions du modèle, sur des serveurs basés aux États-Unis.

Si l’efficacité de DeepSeek-R1 n’est plus à prouver, la réalité derrière sa conception reste un mystère. Le modèle est bel et bien très peu énergivore (on peut le faire tourner en local sur des ordinateurs puissants), mais personne n’a la preuve que DeepSeek n’a dépensé que quelques millions pour le concevoir. Selon OpenAI, qui s’est entretenu avec le Financial Times le 29 janvier, DeepSeek aurait dissimulé un détail important sur la genèse de ses IA : il aurait utilisé ChatGPT pour automatiser l’entraînement de ses modèles.

DeepSeek : un modèle étudiant de ChatGPT ?

OpenAI accuse DeepSeek d’avoir recouru au principe de « distillation des connaissances ». Concrètement, cela permet à un « modèle enseignant » de transmettre son savoir à un « modèle étudiant ». Une entreprise d’intelligence artificielle peut utiliser la distillation pour entraîner des modèles plus petits, en automatisant un scénario où le modèle étudiant poserait des questions au modèle enseignant, puis imiterait ses réponses. L’idée est de ne pas avoir à recommencer le principe d’apprentissage à chaque fois, en se basant sur ses principaux résultats pour aller plus vite.

Si la distillation n’a rien d’inédite, OpenAI interdit à ses concurrents d’utiliser ses modèles pour créer des répliques de ChatGPT dans ses conditions générales d’utilisation. L’entreprise indique au Financial Times qu’elle a trouvé des preuves d’une distillation massive de ChatGPT en 2024. L’entreprise suspecte DeepSeek d’avoir recouru à son API pour interroger massivement ses modèles, afin d’entraîner DeepSeek-V3 et DeepSeek-R1 à moindres frais. Cette technique expliquerait les faibles coûts de conception de DeepSeek : l’entreprise chinoise se serait lourdement servie des serveurs d’OpenAI.

Une conversation avec DeepSeek-R1. // Source : Capture Numerama

Du côté de la Maison-Blanche, cette piste semble aussi prendre du sens. David Sacks, que Donald Trump a choisi pour superviser l’IA et les cryptomonnaies, a expliqué à Fox News qu’il était « possible » que DeepSeek ait « aspiré » les données d’OpenAI. « Il existe des preuves substantielles que DeepSeek a distillé les connaissances des modèles d’OpenAI », indique le responsable. Il appelle les entreprises américaines à prendre des mesures concrètes pour empêcher les concurrents de dérober leur savoir.

Si l’hypothèse d’OpenAI se confirme, DeepSeek ne serait pas le premier à miser sur la distillation pour copier illégalement un concurrent. Ses résultats seraient néanmoins nettement supérieurs à la concurrence, notamment grâce à plusieurs innovations dans l’architecture utilisée, qui lui permet de limiter grandement les coûts. Avec ou sans distillation, l’exploit de DeepSeek reste énorme. L’entreprise a provoqué un effondrement boursier aux États-Unis le 27 janvier, mais la plupart des actions ont commencé à rebondir dès le lendemain.

DeepSeek

Télécharger gratuitement

Toute l'actu tech en un clin d'œil

Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !

Marre des réseaux sociaux ? Rejoignez la communauté Numerama sur WhatsApp !

Tout comprendre à La guerre de l’IA

ChatGPT

Télécharger gratuitement