OpenAI a lancé ce 3 février Deep Research, une nouvelle fonctionnalité pour ChatGPT qui analyse le web et génère des rapports complets. Ses premiers utilisateurs sont sous le charme et se disent ahuris par la justesse des réponses, qui n’a plus rien à voir avec une demande classique (Deep Research peut passer plusieurs dizaines de minutes sur une question).
Les développeurs de Hugging Face, une entreprise d’IA franco-américaine qui héberge de nombreux modèles open source, ont été époustouflés. Ils ont décidé de se lancer un défi : développer un équivalent open source à Deep Research en 24 heures. De quoi s’imposer un peu plus comme une alternative à ChatGPT et à sa vision fermée.
Pourquoi Deep Research et sa réplique par Hugging Face sont des exploits
Hugging Face n’a pas totalement recréé Deep Research en 24 heures. La fonctionnalité d’OpenAI été conçue avec un énorme budget, contrairement à la solution de Hugging Face. Les développeurs le reconnaissent : « sa reproduction ouverte prendra du temps. » Par exemple, l’outil n’est pas encore capable d’analyser des images, contrairement à Deep Research. L’objectif est aussi de le faire fonctionner avec des LLM ouverts, comme DeepSeek-R1 : en fait, ce Deep Research open source a été conçu à l’aide de GPT-o1, un LLM d’OpenAI qui n’est pas ouvert (le vrai Deep Research, lui, utilise o3, qui n’est pas encore disponible).
![Deep Research propose les meilleurs résultats du marché avec le benchmark Humanity's Last Exam. C'est aussi la première fois qu'OpenAI inclut DeepSeek-R1 dans ses comparaisons. Deep Research propose les meilleurs résultats du marché avec le benchmark Humanity's Last Exam. C'est aussi la première fois qu'OpenAI inclut DeepSeek-R1 dans ses comparaisons.](https://c0.lestechnophiles.com/www.numerama.com/wp-content/uploads/2025/02/screenshot-2025-02-03-at-104918-1024x642.png?resize=1024,642&key=ba0109b1)
Pour comparer son outil à celui d’OpenAI, Hugging Face utilise le même test, GAIA (pour General AI Assistants benchmark). Un test complet, réputé difficile, puisqu’il fait appel à plusieurs fonctions des LLM. Le principal défi est de décomposer les questions que le test pose en plusieurs étapes. Cela peut être répondre dans un certain format, recueillir des informations, identifier des éléments dans une image, etc.
L’exploit d’OpenAI avec Deep Research est d’avoir validé le test GAIA avec 67,36 % d’exactitude. Ça ne paraît pas énorme, mais GPT-4 n’atteint même pas 7 %. Deep Research fait près de 10 fois mieux, ce qui permet de se rendre compte de l’avancée qu’il représente.
Quid du modèle de HuggingFace ? Avec o1, qui est moins performant qu’o3, il obtient 54 % de bonnes réponses dans le test GAIA, ce qui permet de le situer dans le haut du panier du classement. Il fait mieux que certains autres LLM bien connus, comme Llama 3 ou même DeepSeek-R1.
Hugging Face s’inspire d’OpenAI pour ses propres outils
C’est tout au long d’un billet de blog qu’une petite équipe de développeurs de Hugging Face raconte comment ils ont réussi cet exploit. Ils disent avoir repris la méthode d’OpenAI, à savoir utiliser un « framework agent », une couche au-dessus du LLM de base qui permet de lui indiquer des actions à réaliser dans un certain ordre. C’est ce qui permet au chatbot d’aller chercher des fichiers PDF et de les faire analyser par le LLM. Si on n’utilisait pas ça, Hugging Face estime que les performances seraient 30 % moins grandes, ou que le chatbot serait 30 % plus cher.
![Les développeurs de Hugging Face racontent comment ils ont recréé Deep Research // Source : Numerama Les développeurs de Hugging Face racontent comment ils ont recréé Deep Research // Source : Numerama](https://c0.lestechnophiles.com/www.numerama.com/wp-content/uploads/2025/02/telechargement-10-1024x498.png?resize=1024,498&key=d0f7c0b5)
Cet agent, il faut bien lui donner des pages web, et donc un navigateur web. Pour optimiser les performances, Hugging Face en a utilisé un avec uniquement du texte, qui soit le plus simple possible. Les développeurs y ont ajouté un inspecteur de texte, qui puisse en lire dans plein de formats. Il s’agit d’outils développés par Microsoft Research et qui sont open source. Ce n’est donc pas aussi complet que chez OpenAI, mais déjà un bon début pour les entreprises qui souhaiteraient répliquer Deep Research dans un cercle plus local.
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.
Marre des réseaux sociaux ? Rejoignez la communauté Numerama sur WhatsApp !