samedi 26 octobre 2024

🐑 Dis ChatGPT, comment dessiner un mouton ?


On le sait, il faut trouver les bons mots pour créer les bonnes images. Mais à quoi sert un bon mot si je n’ai pas la bonne idée ?

Et pourquoi est-ce parfois si difficile de trouver une idée ?

Il y a une raison à ça.

Pour créer une belle image il te faut deux qualités : une bonne imagination associative et une bonne culture visuelle.

Qu’est-ce que ça veut dire ?

Eh bien, par exemple, lorsque tu réfléchis au concept de l’IA au travail, poses-toi ces questions :

  • Quel est le sens que tu veux donner à cette image ?
  • Quelle histoire veux tu raconter ?
  • Au final, quel message veux-tu faire passer ?




Ici, Claude m’a proposé de travailler autour de l’idée “d'expansion de l'horizon créatif” (image générée avec Flux Pro 1.0).


Ensuite, pense aux références culturelles qui te viennent à l’esprit :

Un film ? Une pub ? Une peinture ? Un(e) artiste sur Instagram ? Les paroles d’une chanson ? Un mythe ?

Tu cales ?

Pourtant, nous avons tous une culture visuelle. Mais il n’est pas toujours facile de la faire remonter à la surface.

C’est là que les modèles de langage interviennent. ChatGPT ou Claude ont trois atouts:

1) Ils sont, par nature, doués pour les associations d’idées (tout leur modèle d’entrainement repose sur les associations sémantiques).

2) Ils disposent aussi d’une bonne culture visuelle et artistique. Pense à tous les livres et articles qu’ils ont digéré !

Travailler avec eux, c’est en faire des compagnons créatifs. Ils peuvent t’aider à faire émerger des idées. Mais ils peuvent surtout enrichir ta culture visuelle en te proposant des références auxquelles tu n’aurais jamais pensé.

Ils peuvent aussi te faire explorer des techniques artistiques méconnues qui vont enrichir ta palette créative et te donner de nouvelles idées.




Plutôt que de représenter l’IA comme un robot, ChatGPT m’a proposé de travailler autour de l’idée de la musique et de l’orchestration des tâches et des idées. Il est allé me chercher des références chez Van Gogh et Yayoi Kusama (Image générée avec Flux Pro 1.0)

Mais il y a autre chose, dont nous n’avons pas encore parlé.

Le souci du détail.


3) Les modèles de langage sont efficaces pour décrire en détail ce que tu veux voir dans ton image.

Souvent, ce sont de petits détails qui vont faire la différence entre une image banale et une image forte. Qu’ils soient visuels ou narratifs.

Thierry Murat, dessinateur de bandes-dessinées, me disait : “une image raconte toujours une histoire”.

Elle véhicule un message.

Quand je réalise des portraits par exemple, j’essaie toujours de travailler l’histoire du personnage et générer de l’émotion dans mon image.

Par exemple, essaie d’abord avec ce portrait d’une fille originaire de Mongolie :
portrait d'une jeune fille mongole

Puis essaie avec ça :
Portrait d'une jeune fille mongole. Des yeux profonds et énigmatiques gris-vert-bleu avec des mouchetures d'iris en forme de constellation, des lèvres minces et pâles légèrement écartées, une expression pensive et mélancolique, un regard distant, une aura de sagesse au-delà de son âge, une douce lumière de fenêtre sculptant son visage, des tons riches en noir et blanc, un contraste élevé, un bokeh subtil.





Comment ai-je obtenu ce prompt ? J’ai d’abord travaillé sur l’histoire de cette enfant, puis j’ai demandé à Claude Sonnet 3.5 de générer le prompt pour retranscrire cette histoire dans une représentation visuelle (la couleur des yeux, ce qu’ils expriment, mais aussi la lumière, le contraste, les couleurs etc… c’est cette toile complexe qui concourt à créer une émotion, pas juste “regard mélancolique” !).

Comment créer ton assistant créatif avec Claude ou ChatGPT ?

Il y a deux points essentiels à intégrer dans ton prompt.

1) ChatGPT :  il faut lui expliquer comment faire un prompt.

Pour une illustration, je rajoute toujours cette instruction à la fin de mon prompt :

###Méthode de prompting 

Utilise la méthode suivante : structure le prompt en commençant par le sujet principal, suivi des détails, du type d'illustration, de la composition, de l'éclairage, des couleurs, du style, des influences des grands dessinateurs et illustrateurs. L'élément le plus important à mettre en avant dans l'image doit toujours être au début du prompt. 

Pour une photo, je vais ajouter d’autres éléments :

###Méthode de prompting 

Utilise la méthode suivante : structure le prompt en commençant par le sujet, suivi des détails, du type de photo, de la composition, de l'éclairage, des couleurs, du style, ainsi que des spécifications de la caméra et du film. L'élément le plus important à mettre en avant dans la photo doit toujours être au début du prompt. Sois extrêmement détaillé, chaque détail compte pour refléter ta vision. C'est à toi de réfléchir et de transformer des concepts ou des intentions en descriptions concrètes, par exemple en décrivant comment tu représenterais un individu simple en une icône de résilience et d'espoir

Je rajoute parfois des exemples de bons prompts visuels en les mettant entre crochets : <exemples> … </exemples>.


2) Autre astuce : fais lui se (ou de te) poser des questions. Cela enrichira son approche et améliorera le prompt final.

Par exemple pour un portrait émotionnel :

###Choix du sujet et mode de traitement - Commence par me demander le portrait que je veux réaliser puis pose moi des questions. - Attends mes réponses. - Interroge toi ensuite sur l'histoire de ce personnage. - Réponds aux questions et demande moi de valider avant de passer à l'étape suivante. - Pose toi enfin les bonnes questions que se poserait un portraitiste photo de génie sur tous les aspects de sa photo (sujet, pose, détails, lumière, composition, type d'appareil photo et pellicule, inspiration), puis réponds aux questions. N'omets aucun détail, la précision est clé, c'est de là que vient le génie photographique. - Attends ma validation avant de passer à l'étape suivante.





Quelle est l’histoire de cette petite fille ? 


Avant de te laisser tester tout ça, je t’offre deux prompts que tu vas pouvoir enchainer pour générer de belles images. Je te conseille de les utiliser avec Claude Sonnet 3.5 (que je préfère à ChatGPT), mais tu fais comme tu veux !


Le premier prompt (“Le révélateur”) te permettra de faire émerger une description à partir d’une idée :

Agis comme un "Révélateur", un Partenaire créatif révélateur d'images. Tu maitrises l'art de poser des questions pertinentes pour faire émerger une image mentale, d'analyser les réponses de l'utilisateur pour affiner cette image, de proposer des ébauches de description à chaque étape et de t'adapter au type d'image choisi (personnage, visage, scène ou style). Mon contexte est le suivant : je souhaite révéler progressivement une image mentale grâce à un échange de questions-réponses avec toi. Tu vas faire émerger petit à petit une image (personnage, visage, scène ou style) en me posant des questions et en proposant des ébauches de description à chaque étape, jusqu'à obtenir une révélation finale que je validerai. Pour ça, voici les étapes à suivre : 1. Me demander le type d'image à révéler (personnage, visage, scène, style) 2. Poser une première question pour commencer à faire émerger l'image 3. Analyser ma réponse 4. Proposer une première ébauche de description 5. Poser une nouvelle question ou me demander des corrections 6. Répéter les étapes 3 à 5 jusqu'à ce que je valide la révélation finale Voici les caractéristiques du résultat attendu : - Un échange fluide et naturel de questions-réponses - Des questions pertinentes et adaptées à mes réponses - Des ébauches de description de plus en plus précises - Une révélation finale fidèle à l'image mentale que j'ai en tête Si c'est Ok pour toi, on peut commencer !


Une fois que tu as ta description, transforme la en prompt !

""" [DESCRIPTION]""" 
Transforme cette description en prompt pour une IAG d'images. Voici la structure que tu dois suivre pour écrire le prompt : <structure> [concept général, cadrage et personnages] [Détails et Description] [Caractéristiques et Émotions] [Nature de l'image][Composition et angle] [Défauts et réalisme][Style et Technique][Lumière et Ambiance][Choix du Film][Défaut ou Éléments d'Époque] Ne génère pas d'image, donne-moi juste le prompt. </structure> Rédige en retirant les crochets [].

Ce qu'il faut retenir :

  • Les modèles de langage comme ChatGPT ou Claude peuvent être utilisés comme assistants créatifs pour générer des idées d'images et enrichir ta culture visuelle.
  • La qualité d'une image générée par IA dépend souvent des détails inclus dans le prompt, qui doivent raconter une histoire et véhiculer une émotion ou un message.
  • Pour créer un assistant IA efficace pour la génération d'images, il est important de lui fournir des instructions spécifiques sur la structure du prompt et de lui faire poser des questions pertinentes.

Source : Benoît Raphaël, de Génération IA.

Aucun commentaire:

Enregistrer un commentaire

PROMPTOLOGIE Reviens aux fondamentaux !

Quand on travaille avec ChatGPT, on a vite tendance a essayer des prompts (instructions) très compliqués ou alors trop flous. Je recommande ...