Qu’est-ce qu’un prompt ?
Un prompt est un mot anglais qui désigne toute commande écrite envoyée à une « intelligence artificielle » spécialisée dans la génération de contenu, comme du texte ou des images. En somme, il s’agit d’une instruction que l’on donne à un algorithme, qui va ensuite l’interpréter et proposer un résultat. On peut aussi concevoir le prompt comme une demande ou un ordre.
Que peut-on générer avec un prompt ?
Tout dépend de la spécialité de l’IA génératrice. Dans le cas de ChatGPT, c’est du texte. On lui pose une question et le chatbot répond par écrit. Il s’ensuit un échange, comme s’il s’agissait d’une conversation dans une messagerie avec l’un de ses contacts. Cela peut aussi être des images (DALL-E, Midjourney) ou des sons et de la musique (MusicLM).
Aujourd’hui, les outils sont spécialisés dans un domaine, mais on peut s’attendre à l’arrivée prochaine de plateformes « universelles », c’est-à-dire capables de générer des résultats sous différentes formes (texte, image, vidéo, son…). On pourrait aussi voir apparaître une approche multimodale, en proposant une instruction qui mêlerait de l’écrit et une image.
Comment générer un prompt ?
Sur DALL-E ou ChatGPT, il suffit d’inscrire son texte dans la zone prévue à cet effet. Dans le cas de Midjourney, il faut taper une commande précise, qui commence par « /imagine » (sans les guillemets), suivie par votre description. Par exemple « /imagine un panda roux brillant traversant la Voie lactée assis sur une étoile ».
Notez qu’il existe aussi d’autres commandes pour lancer un prompt sur Midjourney. L’une d’elles s’appelle « /blend ». Cette commande sert à fusionner plusieurs images sur Midjourney — c’est-à-vous de les fournir. Attention, à ce sujet, à deux choses : si vous utilisez des images sous droit d’auteur, les artistes s’y opposent peut-être. En outre, les images que vous envoyez sont publiques.
Comment faire un bon prompt ?
Il n’y a pas de secret pour faire un bon prompt. Il faut faire preuve d’imagination et fournir un maximum de matière à l’intelligence artificielle. Plus votre description sera précise et détaillée, meilleur sera le résultat. Cela veut dire qu’il va vous falloir ajouter des mots-clés dans votre texte pour que l’algorithme ait à disposition tout ce qui vous intéresse.
Vous pouvez d’ailleurs aller assez loin dans votre quête et obtenir des rendus tout à fait spectaculaires. En donnant des instructions sur l’éclairage, le style, l’angle de vue. En ajustant la couleur ou l’ambiance. En jouant sur le zoom ou la composition. Parfois, vous n’aurez rien de bien au premier résultat. Alors, il vous faudra modifier votre prompt.
Il existe des ressources en ligne qui peuvent vous aider. Par exemple, ce site a écrit un PDF servant de recueil pour des prompts sur DALL-E. OpenAI, l’entreprise qui a développé DALL-E et ChatGPT, fournit sur cette autre page un guide pour générer du texte avec son chatbot. Mais, le mieux reste sans doute d’expérimenter pour voir comment les choses marchent.
Reste une question : faut-il passer son instruction en anglais ou en français ? On a pu constater que les instructions étaient comprises en français. Cependant, comme ce sont des outils conçus par des entreprises américaines, l’usage de l’anglais peut être une option à considérer. Si vous peinez à avoir tout le vocabulaire adéquat pour votre prompt, n’hésitez pas à utiliser DeepL.
Quelques exemples de prompt
Voici quelques prompts passés sur DALL-E :
- A portrait of a dog in a library, Sigma 85mm f/1.4 (résultat)
- A grey kitten standing on a pizza in outer space. The kitten is eating a piece of pizza. Pizza slices flying with angel wings in background, dark cyan galaxy and stars in background, 4K photoshopped image, look at that detail (résultat)
- a male American high school student reading a newspaper, in Chinese watercolor, award-winning painting (résultat)
- full body photo of a horse in a space suit (résultat)
- Jackson Pollock, Air Jordan sneakers, digital art, product photography (résultat)
Il existe bien d’autres exemples à découvrir sur Twitter, Instagram et le reste du web, que ce soit avec DALL-E ou Midjourney. Ce qu’il s’agit de montrer ici, c’est la variété de rendus que l’on peut obtenir, que votre prompt soit bref ou détaillé. Tout dépend du degré d’orientation que vous souhaitez donner à l’IA, en mobilisant du vocabulaire issu de l’art ou de la photo.
Où voir d’autres prompts (et les résultats) ?
Si vous manquez d’inspiration ou si vous voulez voir d’autres créations, il existe des outils et des galeries en ligne. Il existe aussi des tas de visuels à dénicher sur les réseaux sociaux.
Ce site génère des prompts à la volée (comme « Darth Vader with grey hair holding bushes in a football stadium, Realistic painting, 4K HD » ou « Cucumbers glowing and vibrating in a bus stop, Cover of Rolling Stone magazine »). À vous ensuite de les générer ! Sur DALL-E, vous pouvez aussi re-générer des images alternatives sur des prompts déjà utilisés.
Dans le cas de Midjourney, vous pouvez voir la création d’autres internautes. Pour cela, vous devez rejoindre le Discord de Midjourney. Vous pourrez consulter des images déjà créées, mais aussi les récupérer si vous le désirez. Vous aurez le choix de demander d’autres variations sur des visuels qui ont attiré votre attention, ou bien relancer une toute nouvelle génération.
Comment faire de meilleurs prompts ?
Votre meilleur atout pour améliorer vos prompts sera d’utiliser du vocabulaire précis pour écrire la requête et de faire une description aussi complète que possible. Il y a aussi un volet technique, peut-être moins connu : ce sont les paramètres. Cela ne vaut pas pour toutes les IA génératrices de contenu. Midjourney, par exemple, s’en sert, mais pas DALL-E.
Parmi les commandes classiques, il y a celles qui fixent la taille de l’image affichée. Par exemple, l’ajout de « –ar 4:3 » (sans les guillemets) permet de calibrer le visuel à un affichage au ratio pour la TV. Il existe d’autres commandes techniques, comme « –chaos » pour le niveau d’abstration. Ce site recense plusieurs paramètres que vous pouvez ajouter à vos prompts.
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.
Si vous avez aimé cet article, vous aimerez les suivants : ne les manquez pas en vous abonnant à Numerama sur Google News.