Google se tire la bourre avec OpenAI sur la génération de vidéos. Ce dernier avait lancé fin 2024 Sora, sa solution maison ; Google a riposté avec Veo 2, la nouvelle version de son modèle d’intelligence artificielle. Et depuis le 15 avril, on peut même l’utiliser sur le chatbot Gemini, y compris en France. Voici comment s’y prendre.
Comment utiliser Veo 2 dans Gemini pour créer de courtes vidéos ?
La principale restriction est financière : pour utiliser Veo 2, il faut être abonné à Gemini Advanced, l’abonnement payant du chatbot. Il est proposé à 21,99 euros par mois. On ignore si la fonction sera disponible pour les utilisateurs gratuits.
Pour générer des vidéos dans Gemini :
- Sélectionnez Veo 2 dans le menu déroulant des modèles disponibles ;
- Rédigez votre « prompt » en décrivant le plus précisément possible la vidéo voulue ;
- Entrez votre requête et patientez (une minute environ).

Une fois que c’est fait, Gemini va générer une vidéo de 8 secondes dans une qualité de bonne qualité (720p) au format paysage 16:9, le tout dans un fichier MP4. On peut ensuite lire et télécharger la vidéo pour conserver le fichier sur son ordinateur. À noter que toutes les vidéos sont marquées d’un filigrane invisible, SynthID, afin de montrer qu’elles ont été générées avec de l’IA.

Comme nous avons pu le tester, pour le moment Veo 2 offre des résultats très limités, avec énormément de défauts, y compris par rapport à Sora. Le modèle gère mal la physique, les mouvements sont peu naturels et les objets peuvent interagir de manière improbable ou avec des distorsions visuelles.
Whisk Animate : aller plus loin dans la génération de vidéos
Google mène plein d’expérimentations en rapport avec l’IA et l’une d’entre elles s’appelle Whisk. L’entreprise la présente comme une plateforme d’IA générative qui permet aussi d’utiliser Veo 2. Avec Whisk, on peut générer des vidéos à partir d’une image, pour l’animer comme on le souhaite. Le modèle ajoute automatiquement du mouvement. On peut inclure ou non des instructions textuelles pour préciser ce qu’on souhaite.
Whisk est donc le futur de la génération de vidéos dans Gemini : c’est là qu’on trouve les futures fonctionnalités de Veo 2. Malheureusement, impossible de le tester depuis la France : Whisk est inaccessible. Même chose que pour Gemini, il faut un abonnement à Google One AI Premium pour pouvoir l’utiliser.
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.

Toute l'actu tech en un clin d'œil
Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !
Marre des réseaux sociaux ? Rejoignez la communauté Numerama sur WhatsApp !