Trop petites, les photos que génère Midjourney ? Plus maintenant. Une option vient de voir le jour parmi les commandes du service, afin de récupérer des images dans un format agrandi. C’est ce qu’on peut lire dans l’annonce du jour de David Holz, le fondateur de l’IA générative spécialisée dans le dessin. Il a partagé la nouvelle le 19 octobre sur son serveur Discord.
« Nous sortons deux nouveaux upscalers aujourd’hui, un upscaler 2x et un upscaler 4x », déclare l’intéressé. Les nouveaux paramètres sont visibles directement sur la v5 de Midjourney ou sur Niji (la version « manga » de Midjourney), sous n’importe quelle image. Les options sont visibles une fois que l’internaute choisit une image parmi les quatre proposées par l’outil.
« L’upscaler est subtil et tente de garder les détails aussi proches que possible de l’image originale, mais ne peut pas corriger les défauts ou les problèmes d’une ancienne image », prévient-il. Il est possible de se servir de ces options sur des photos déjà générées, en utilisant une commande particulière « /show job_id » et l’identifiant de l’image en question.
La fonctionnalité étant récente, David Holz prévient qu’il y a encore des petits bugs à résoudre : dans de très rares cas, une image noire ou corrompue peut apparaître en faisant un upscale 4x. Certaines images agrandies peuvent aussi être légèrement assombries durant le processus. Les images floues de base ne sont pas rendues plus nettes en montant en taille.
La veille du lancement, l’intéressé sondait encore sa communauté à ce sujet, en demandant laquelle de ces deux options (une permettant d’agrandir à 2 048 pixels de large, l’autre à 4 096 pixels) aurait sa préférence. En somme, le choix résidait entre une image d’une définition en « 2k » (définition de 2 048×1 080 pixels) et une autre d’une définition en « 4k » (4 096×2 160 pixels).
Une option réclamée depuis des mois
Les dimensions insuffisantes des visuels générés par Midjourney constituaient un motif d’insatisfaction de longue date parmi les membres du service. En mai, Grudd s’agaçait de l’absence d’une option débouchant sur une image de plus grande taille. « Je suis très frustré par le problème de résolution sur votre plateforme », s’agaçait-il, pointant aussi un manque de réponse de Midjourney.
L’internaute, très mécontent, rejetait également la perspective de faire un traitement d’image post-génération, en l’agrandissant avec Photoshop, par exemple. « C’est un pansement, pas une solution. J’ai besoin d’un point de départ en haute résolution », réclamait-il. Un agacement qui avait fini par atteindre son but, puisque David Holz lui avait répondu dans la journée.
À l’époque, le fondateur de Midjourney suggérait une évolution de cette nature avec la version 6 de son IA générative, qui n’est pas sortie à ce jour — actuellement, on en est à la v5.2, sortie en juin 2023. « Nous essayons d’améliorer la résolution de la v6 et éventuellement l’upscaling, mais l’équipe est un peu sous l’eau en ce moment », confiait-il au cours du printemps.
Par le passé, il a existé des options d’upscaling dans les anciens modèles de l’outil génératif, comme on peut le lire dans la documentation de Midjourney. Sur Discord, David Holz indiquait en février qu’elles étaient en train d’être déconsidérées : « Il s’agit plutôt d’une fonctionnalité héritée, qui n’est pas recommandée pour la v4 et qui ne sera pas disponible pour la v5. »
De base, la version 5 de Midjourney génère des images de 1 024 pixels de côté. En version 4, qui avait accès à un upscaler, c’était 512 pixels de côté. La hauteur et la largeur peuvent varier selon le ratio choisi : une image en 16/9e aura une largeur de 1 456 pixels sur 816 pixels de haut. La version 5 a une option pour ajouter du décor via un dézoom, mais cela se fait dans les dimensions de base.
« Il y a souvent un décalage entre les demandes et les fonctionnalités »
David Holz
Depuis, le sujet est revenu épisodiquement. David Holz avait cherché aussi à calmer les attentes de sa communauté : « Malheureusement, il y a souvent un décalage entre les demandes et les fonctionnalités ». Celui-ci prend ‘ailleurs régulièrement le pouls de sa communauté (via des sondages) sur divers sujets, mais aussi sur les fonctionnalités qui ont davantage sa faveur.
Finalement, il n’aura pas été nécessaire d’attendre ni la v6 de Midjourney ni la v5.3. Les indices s’accumulaient pour un lancement bien avant. C’est ce que relevait la consultante Alie Jules, qui suit de très près les développements chez Midjourney. Elle notait le 27 septembre qu’un upscaler est bien sur les rails, pour une définition de 2 000 par 2 000 pixels (2k par 2k, en somme).
Il y avait toutefois une incertitude sur la date de de déploiement (on pensait aussi que la fonction allait être livrée avec Midjourney v5.3). C’est donc par surprise que le lancement a eu lieu, le 19 octobre. Alie Jules anticipait une sortie autour du 13 ou du 15 octobre. C’était presque bon, à une petite semaine près.
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.
Abonnez-vous gratuitement à Artificielles, notre newsletter sur l’IA, conçue par des IA, vérifiée par Numerama !