Michelle Brändle
En coulisse

Découvrir « DALL-E », le générateur d’images par IA

Outre ChatGPT, OpenAI propose également un générateur d’images, appelé « DALL-E ». Ce dernier permet de générer des images à partir de descriptions textuelles et de marquages.

Avec DALL-E, vous pouvez désormais créer des images via la version payante de ChatGPT et traiter celles de DALL-E. Tout ne se passe pas comme prévu. Il vous faut toujours de la patience et du calme pour obtenir le résultat souhaité.

Dans ChatGPT, je trouve à gauche le générateur d’images, appelé DALL-E.
Dans ChatGPT, je trouve à gauche le générateur d’images, appelé DALL-E.
Source : Michelle Brändle

L’utilisation elle-même est simple. Soit vous décrivez à DALL-E dans la fenêtre de chat ce qui doit être modifié à l’aide d’un prompt (invite). Ou bien par le nouvel outil de marquage. Vous le sélectionnez en cliquant sur l’icône de pinceau plongeant en haut de la fenêtre de chat. Vous avez trois possibilités :

  • ajouter quelque chose à l’endroit ou à l’objet marqué ;
  • supprimer des objets marqués ;
  • modifier la zone marquée.

Le traitement ne fonctionne qu’avec des images créées par DALL-E. Mais on peut aussi télécharger celles déjà traitées par DALL-E. Je crée moi-même mon modèle avec le générateur d’images.

Avec le prompt suivant, DALL-E génère une illustration en une minute :

Generate a fairy world in pink with unicorns, butterflies and a castle and lots of flowers

En français : « Crée-moi un paysage féerique rose avec des licornes, des papillons, des fleurs et un château. »

DALL-E répond sous l’image générée par un long texte en anglais qui paraphrase un peu mon souhait et me dit que je peux procéder à d’autres corrections :

«Here's the fairy world you envisioned, brought to life in hues of pink with majestic unicorns, delicate butterflies, a whimsical castle, and a sea of flowers. I hope this matches the magical scene you had in mind! If you'd like any changes or additional elements, feel free to let me know.»

Un paysage féerique avec un château et des licornes, est trop kitsch, à mon goût. Je veux changer cela.
Un paysage féerique avec un château et des licornes, est trop kitsch, à mon goût. Je veux changer cela.
Source : Michelle Brändle

L’image est encore trop rose pour moi. Et je trouve qu’il y a trop de papillons. Je veux les supprimer. Pour cela, je prends l’outil de sélection, marque quelques papillons et demande à l’IA de les effacer.

Je marque les papillons que je veux effacer.
Je marque les papillons que je veux effacer.
Source : Michelle Brändle

DALL-E a eu besoin de deux essais. La première fois, l’IA réduit les papillons au lieu de les éliminer. Elle a besoin d’environ une demi-minute de temps de calcul pour chaque changement.

Le résultat est réussi après le deuxième essai, les papillons ont été enlevés.
Le résultat est réussi après le deuxième essai, les papillons ont été enlevés.
Source : Michelle Brändle

Pour ajuster les couleurs, je décris à DALL-E mon souhait en une phrase. Plus de couleurs, moins de rose. Il est intéressant de noter que l’IA ne modifie pas seulement les couleurs, mais l’ensemble de l’image :

Après un ajustement souhaité des couleurs, l’image est différente. Maintenant, je ne l’aime plus.
Après un ajustement souhaité des couleurs, l’image est différente. Maintenant, je ne l’aime plus.
Source : Michelle Brändle

Le château et les licornes sont différents. C’est dommage et involontaire. Même le format de l’image est moins large. J’en ai assez de l’agitation colorée et je tente une adaptation radicale avec un scénario d’horreur sombre :

DALL-E peut revoir entièrement mon idée de départ et me propose une version plus sombre du pays des fées si je le souhaite.
DALL-E peut revoir entièrement mon idée de départ et me propose une version plus sombre du pays des fées si je le souhaite.
Source : Michelle Brändle

Ici aussi, DALL-E modifie toute l’image. Rien n’est plus comme avant. Certains essais montrent des changements inattendus, comme une armée sombre de fées devant le château. Le résultat m’a parfois plu : des squelettes de licornes sombres. Parfait.

Et si je combinais maintenant les idées sombre et joyeuse ? J’ordonne à l’IA de placer une licorne rose au centre. Pour cela, j’ai fait une marque à l’endroit souhaité :

L’ordre de mettre une licorne rose réaliste à un endroit vide s’avère plus difficile que prévu.
L’ordre de mettre une licorne rose réaliste à un endroit vide s’avère plus difficile que prévu.
Source : Michelle Brändle

Je n’aime pas la licorne tachetée qui en résulte. Après plusieurs essais, l’adaptation ne fonctionne pas. L’endroit reste vide lorsque je demande à DALL-E de générer une licorne d’apparence réaliste. Ce n’est pas faux, car une licorne réaliste ne signifie en fait pas une licorne du tout. Même avec des invites formulées différemment, aucun changement. J’ordonne à DALL-E d’insérer plus de licornes. Ici aussi, l’IA ne fait pas ce que je souhaite. Avant d’aggraver la situation, je ferais mieux d’arrêter.

Après plusieurs tentatives, la situation ne fait qu’empirer.
Après plusieurs tentatives, la situation ne fait qu’empirer.
Source : Michelle Brändle

Conclusion : inspirante, oui, efficace, non

Au premier abord, il semble pratique de pouvoir adapter les images à ma guise via l’IA DALL-E. Mais elle a plusieurs points faibles. Si je veux supprimer un objet, l’IA le remplace souvent par un autre. Si je veux modifier quelque chose sans utiliser l’outil de marquage, l’IA adapte directement toute l’image. Un château a l’air différent après un ajustement des couleurs. Avec de la patience, j’obtiens tout de même des images utilisables. Dans tous les cas, des surprises vous attendent.

Ma conclusion sur l’IA de création d’images ne change pas, malgré la nouvelle fonction de traitement de DALL-E. C’est un outil non sophistiqué qui sert de source d’inspiration pour vos propres images. C’est tout ce qu’elle doit et devrait pouvoir faire, du moins pour moi.


Vous trouverez ici d’autres outils d’IA que j’ai déjà testés pour vous :

  • En coulisse

    Mon hit de l'été 2024 chez Digitec grâce au programme d'IA Suno

    par Michelle Brändle

  • Nouveautés + tendances

    Faites-le avec un gribouillage : outil d'IA "Stable Doodle

    par Michelle Brändle

  • Nouveautés + tendances

    Un chatbot différent : un GPT débile comme interlocuteur impertinent

    par Michelle Brändle

  • En coulisse

    Le nouveau générateur d’images d’Adobe est certes performant, mais a ses limites

    par Michelle Brändle

Photo d’en-tête : Michelle Brändle

Cet article plaît à 33 personne(s)


Ces articles pourraient aussi vous intéresser

  • En coulisse

    Le nouveau générateur d’images d’Adobe est certes performant, mais a ses limites

    par Michelle Brändle

  • En coulisse

    StableDiffusion : des images à partir d’une saisie de texte

    par David Lee

  • En coulisse

    "Adobe Firefly" : L'application web génère désormais des vidéos d'IA

    par Michelle Brändle

Commentaire(s)

Avatar