Il y a quelques années, avec son ancienne filiale Boston Dynamics, Google avait pris beaucoup d’avance en robotique. L’entreprise a depuis revendu cette activité à SoftBank, qui l’a lui même cédé à Hyundai. Google est devenu un acteur plus petit de la robotique, mais pourrait rapidement changer la dynamique.
Dans un billet de blog publié le 12 mars, Google annonce deux innovations majeures dans la course aux robots. L’entreprise californienne va lancer Gemini Robotics et Gemini Robotics-ER, deux modèles conçus pour donner de « l’intelligence » à des robots.
Gemini Robotics : l’IA sort des écrans pour contrôler les robots
Dans un futur plus ou moins proche, plusieurs acteurs de la Silicon Valley croient en une explosion du marché de la robotique. Nvidia et Tesla, par exemple, sont convaincus que tous les foyers possèderont leur robot domestique. Ce robot pourrait s’occuper du rangement, de la cuisine et de la surveillance de la maison.
Il y a néanmoins un obstacle de taille : comment rendre un robot intelligent ? C’est ici que Google DeepMind intervient. L’entreprise ne veut plus fabriquer ses propres robots, mais leur donner un moteur visuel. Elle lance deux projets simultanément :
- Gemini Robotics, qui est un « VLA », un modèle « Vision-Language-Action ». Dérivé de Gemini 2.0, il vise à donner des instructions physiques au robot. Là où une IA a pour habitude de répondre avec des mots, Gemini Robotics peut faire des choses. Google le présente comme généraliste (capable de discuter de tout), interactif (capable de deviner ce qu’on attend de lui) et minutieux (il doit pouvoir manipuler avec précaution des objets, en donnant des consignes avce plusieurs étapes).
- Gemini Robotics-ER, qui est un « VLM », pour « vision-language model ». Ici, il s’agit de compréhension de l’espace. Le modèle est entraîné pour reconnaître des environnements 3D et prédire des mouvements. Exemple : on lui tend une tasse de café, il doit deviner où arrivera votre main pour attraper la tasse au bon moment. C’est aussi Robotics-ER qui se charge de refuser une action, si elle est jugée trop dangereuse car proche d’un mur par exemple.

En plus des robots humanoïdes, qui ont pour avantage de pouvoir s’adapter aux espaces des humains, Gemini Robotics peut contrôler plus généralement n’importe quel robot avec des « bras » — ce qui est, on ne va pas se mentir, le gros de l’industrie. L’entreprise annonce un partenariat avec Apptronik pour créer des robots humanoïdes, mais compte aussi partager Gemini Robotics-ER avec Agile Robots, Boston Dynamics et Enchanted Tools.
Quid des enjeux sociétaux et de la peur de Terminator ? Google insiste sur sa prudence, avec notamment un conseil d’experts pour délimiter les usages. L’idée avec Gemini Robotics est d’encadrer les robots, pas de les libérer.
Gemma 3 : Google lance un modèle open source
Parallèlement à l’annonce de Gemini Robotics, qui est un modèle propriétaire comme l’ensemble de la famille Gemini, Google a annoncé Gemma 3, la nouvelle version de son modèle open source. Cette réponse à DeepSeek-R1, que n’importe qui peut installer, se décline en quatre modèles avec 1, 4, 12 ou 27 milliards de paramètres. Google annonce des résultats parmi les meilleurs du marché, avec de nombreux usages possibles en local.

Gemma 3 peut être téléchargé par n’importe qui avec une machine suffisamment puissante, sur Hugging Face notamment.
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.

Toute l'actu tech en un clin d'œil
Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !
Marre des réseaux sociaux ? Rejoignez la communauté Numerama sur WhatsApp !