La guerre de l’intelligence artificielle entre OpenAI et Google reprend de sa splendeur avec l’annonce de nombreuses nouveautés chez Google, qui vient contrecarrer les 12 jours d’annonces du créateur de ChatGPT. Au programme : Gemini 2.0 et plusieurs nouveaux projets.

Depuis le 5 décembre 2024, OpenAI fait une annonce par jour. Le créateur de ChatGPT, qui aime être au centre de l’attention, mise sur ce qu’il présente comme un calendrier de l’avent pour faire parler de lui. Il a déjà annoncé le nouveau modèle o1, l’abonnement ChatGPT Pro et Sora, son générateur de vidéos réalistes. D’autres annonces sont attendues dans les prochains jours, comme le modèle GPT-4.5.

Face à cette vague d’annonces d’OpenAI, ses concurrents s’activent pour ne pas laisser toute la lumière à l’entreprise. Après xAI qui a dévoilé un nouveau générateur d’images, c’est au tour de Google de faire plusieurs annonces. Le géant du web lance notamment Gemini 2.0, une évolution majeure de son modèle de langage.

Gemini 2.0 : Google lance un LLM multimodal beaucoup plus sophistiqué

Un an après la première version de Gemini, Google a annoncé le 11 décembre Gemini 2.0, son « modèle le plus capable à ce jour ». Ce LLM multimodal est capable de générer des images et du son, ce qui lui permettra de devenir un assistant vocal encore plus perfectionné. Google lui imagine plusieurs usages, comme la génération « d’agents IA ». Ils pourraient un jour vous parler comme des humains.

Les versions les plus abouties de Gemini 2.0 entrent en phase de test, mais ne sont pas encore accessibles du grand public. En revanche, Gemini 2.0 Flash, une version allégée conçue pour répondre rapidement, est disponible gratuitement pour tous les utilisateurs du chatbot de Google dès aujourd’hui. Gemini 2.0 sera prochainement intégré aux AI Overviews, qui résument les recherches Google grâce à l’IA. Google répond ainsi à Perplexity et à ChatGPT Search, qui commencent de plus en plus à lui faire de l’ombre.

Selon Google, le modèle Gemini 2.0 Flash est plus puissant que Gemini 1.5 Pro, alors qu’il est normalement conçu pour des tâches simples. Les premiers benchmarks fournis par l’entreprise sont très encourageants et suggèrent que Gemini 2.0 Pro et Gemini 2.0 Ultra seront au niveau des meilleurs modèles concurrents. La génération native d’audio ouvre de nouvelles perspectives pour l’assistant de Google, qui pourrait être beaucoup plus « émotionnel » et ainsi s’aligner sur ChatGPT Voice.

Project Astra : Google donne des nouvelles de son assistant vocal

Google ne se contente pas de dévoiler Gemini 2.0. Le géant du web, qui dit que l’IA entre dans « l’ère des agents », profite de sa présentation de décembre pour dévoiler des détails sur ses futurs projets. Google revient notamment sur Astra, son IA capable de « voir » et de commenter vocalement tout ce qu’il se passe à l’écran.

Le projet Astra de Google répond à OpenAI avec Gemini. // Source : Google
Le projet Astra de Google peut commenter le monde en temps réel. Il ouvre la porte à des lunettes connectées. // Source : Google

Grâce à Gemini 2.0, Google indique qu’Astra peut dialoguer naturellement et mélanger les langues. Il peut aussi accéder à des outils externes comme Search, Lens et Maps, grâce à sa capacité à piloter d’autres plateformes nativement. Astra est aussi plus rapide et dispose d’une mémoire de 10 minutes par conversation.

Dans le futur, le projet Astra pourrait devenir l’assistant vocal par défaut de l’application Gemini. Google dit aussi avoir commencé à tester des lunettes connectées équipées de son assistant vocal. La marque confirme ainsi les rumeurs sur l’existence d’un tel produit.

Project Mariner : une extension Chrome pensée pour Gemini

Autre annonce du jour : le Project Mariner, qui prend la forme d’une extension Chrome. Il s’agit d’un menu latéral similaire à celui de la suite Google, qui est capable de naviguer sur le web à votre place. Il suffit de lui donner une consigne : il explore le web et extrait des informations pour vous. Le principal avantage par rapport à une utilisation humaine est que Mariner va vite et remplit les formulaires à votre place, avec la possibilité d’être mis en pause quand vous le souhaitez.

Jules et le jeu vidéo : Google a d’autres idées pour Gemini 2.0

Enfin, Google présente d’autres projets envisagés avec Gemini 2.0. Il y a notamment Jules, un agent dédié aux développeurs, mais aussi l’idée de développer des agents capables d’explorer des mondes ouverts dans des jeux vidéo pour aider leurs créateurs. Ces agents pourraient effectuer des recherches sur le web pour aller trouver des choses à faire dans une carte. Autre usage possible : celui d’un assistant pour aider un joueur débutant. On pourrait lui demander comment réussir un niveau, et il interagirait automatiquement avec la console pour faciliter cette tâche.

Découvrez les bonus

+ rapide, + pratique, + exclusif

Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.

Découvrez les nombreux avantages de Numerama+.

S'abonner à Numerama+

Vous avez lu 0 articles sur Numerama ce mois-ci

Il y a une bonne raison de ne pas s'abonner à

Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.

Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :

  • 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
  • 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
  • 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.

Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.

S'abonner à Numerama+

Si vous avez aimé cet article, vous aimerez les suivants : ne les manquez pas en vous abonnant à Numerama sur Google News.