C’est indéniablement une nouvelle claque stupéfiante dans le domaine de l’intelligence artificielle. Déjà connue dans le monde entier pour avoir lancé le fameux agent conversationnel ChatGPT, l’entreprise américaine OpenAI a créé la surprise dans la soirée du 15 février avec la présentation de Sora, son modèle de génération de vidéos.
Sora ou le « ChatGPT de la vidéo »
Avec Sora, OpenAI ajoute une nouvelle corde à son arc. Dans le domaine de la génération du texte, on connaissait déjà ChatGPT. Du côté du dessin et de la peinture, on peut compter sur Dall-E. Des projets plus expérimentaux ont aussi existé, comme MuseNet, un outil de création musicale, ou Whisper, pour retranscrire de la voix en texte.
Sora a une capacité multimodale : il transforme du texte et de l’image en vidéo. La durée actuelle de chaque séquence générée atteint la minute. Ces scènes incluent, selon OpenAI, « des scènes très détaillées, des mouvements de caméra complexes et de multiples personnages aux émotions marquées. »
D’après l’entreprise, Sora peut développer des vidéos pour des écrans de grande taille, en 1920 par 1080 pixels, des vidéos verticales en 1080 par 1920 pixels, et tout ce qui se trouve entre ces deux formats. Sora peut ainsi « créer du contenu pour différents appareils directement compatible avec leur format d’origine. ».
Un papier de recherche accompagne l’annonce de Sora, mais OpenAI et Sam Altman ont bien compris que ce sont les vidéos qui marqueront avant tout les esprits. Depuis l’annonce du modèle, l’entreprise et son fondateur publients plusieurs démonstrations sur X (ex-Twitter), avec leurs propres prompts ou en répondant à des requêtes de tiers.
Sam Altman génère des vidéos avec Sora pour les internautes
Sora n’est pas encore accessible. C’est pourquoi Sam Altman a proposé de générer pour les internautes quelques visuels. « Nous aimerions vous montrer ce que Sora peut faire, merci de répondre avec des légendes pour les vidéos que vous aimeriez voir et nous commencerons à en faire ! Ne vous retenez pas sur les détails ou la difficulté ! ».
Plusieurs autres démonstrations ont été partagées également sur le compte officiel d’OpenAI sur X :
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.
Si vous avez aimé cet article, vous aimerez les suivants : ne les manquez pas en vous abonnant à Numerama sur Google News.