Dans la guerre de l’intelligence artificielle générative, OpenAI et Google sont très certainement les deux figures majeures. Le premier a transformé l’industrie avec ChatGPT, le second lutte pour récupérer sa position naturelle de leader. Google rattrape progressivement son retard sur OpenAI, notamment avec son écosystème Gemini qui ne cesse de gagner en capacités.
Comment embêter OpenAI, qui fait actuellement une annonce par jour ? En le parasitant avec ses propres annonces, évidemment. Après Gemini 2 la semaine précédente, Google a annoncé Veo 2 et Imagen 3, deux nouveaux modèles de génération de vidéos et d’images, le 16 décembre. Son communiqué de presse est sorti 30 minutes avant le jour 8 des annonces d’OpenAI.
Veo 2 : Google met à l’honneur ce que Sora ne fait pas bien
Dans son communiqué de presse, Google présente Veo 2 comme le meilleur outil de génération de vidéos de l’industrie. Le successeur de Veo 1, qui avait été annoncé en mai 2024, est capable « de comprendre la physique du vrai monde et les mouvements, le tout en définition 4K » explique Sundar Pichai, le patron de Google. Pourquoi mettre ces arguments en avant ? Parce qu’il s’agit des points faibles de Sora, l’outil lancé par OpenAI une semaine plus tôt.
Veo 2 est capable d’imiter des genres cinématographies, de reproduire le style d’une lentille, de suggérer des effets et peut concevoir des vidéos de plusieurs minutes, là où Sora se contente de secondes. Les exemples publiés par Google sont assez impressionnants, avec des résultats finaux qui ressemblent à de vraies vidéos. Google indique que Veo 2 n’hallucine que très peu, ce qui réduit le risque d’avoir un main à six doigts. L’outil peut être testé avec une file d’attente, même si disponibilité en Europe est logiquement bloquée.
Imagen 3 : Google améliore son modèle de génération d’images
En plus de Veo 2 pour les vidéos, Google profite de son communiqué de presse pour dévoiler Imagen 3, la nouvelle version de son modèle de génération d’images. Dans un contexte de hype autour de Grok et Elon Musk, avec son modèle qui réplique des visages connus, Google dit proposer un modèle capable de « générer des images plus lumineuses et mieux composées, des styles artistiques plus variés avec une plus grande précision, du photoréalisme à l’impressionnisme, de l’abstrait à l’anime ».
Pour l’instant, Imagen 3 n’est pas intégré à Gemini. Le modèle est disponible depuis ImageFX, l’outil de Google pour expérimenter ses nouvelles IA. à terme, on imagine qu’il sera possible de générer des images depuis le chatbot.
Quid d’OpenAI ? L’entreprise n’a pas encore dévoilé de nouvelle version de DALL-E, son modèle de génération d’images, mais tout laisse penser qu’il s’agira d’une des dernières annonces des 12 jours de son calendrier de l’avent.
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.
Abonnez-vous à Numerama sur Google News pour ne manquer aucune info !