Für jeden Blogeintrag ein passendes Bild zu finden, ist manchmal recht schwierig. Das neue Programm Dall-E von OpenAI macht das nun einfacher. Aus Textbeschreibungen kreiert die künstliche Intelligenz Bilder in verschiedenen künstlerischen Stilrichtungen.
Manchmal habe ich sehr schnell ein passendes Bild und manchmal braucht es ein paar Versuche. Nachfolgend ein Beispiel, wie ich zum letzten Blogbild gekommen bin.
1. Idee für ein Bild
Ich habe mir überlegt, dass ich für den Blog zu Learning in Public ein Bild mit einem offenen Kopf mit einem Gehirn möchte.
2. Handzeichnung
Als erster Versuch, füttere ich Dall-E mit folgender Textbeschreibung:
“A hand drawn sketch of a head with an open top showing the brain”
Dall-E generiert jeweils vier Bilder. Dies ist das Resultat:

3. Eine offene Tür
Ich wollte jedoch gerne einen geöffneten Deckel auf dem Kopf. Also habe ich die Textbeschreibung angepasst.
“A hand drawn sketch of a head with an open skull door showing the brain inside”

Leider hat Dall-E das nicht verstanden und generiert ein Bild mit einer offenen Tür.
4. Ein offener Kopf
Ich versuche nochmals eine kleine Änderung:
“A hand drawn sketch of a head with an open skullcap showing the brain inside”

Nun kommen wir der Sache näher. Das erste Bild gefällt mir, aber das Hirn sieht eher aus wie ein Truthahn auf einem Teller.
5. Neue Variationen
Man kann Dall-E auch ein Bild geben und ihn davon Variateionen genereiren lassen. Ich wähle das erste Bild und lasse ihn vier Varianten davon erstellen:

Hier gefällt mir das dritte Bild. Aber dann entscheide ich mich, doch noch etwas Farbe in die Sache zu bringen.
6. Im Stil von Johannes Vermeer
Irgendwo sehe ich ein Beispielbild von Johannes Vermeer. Also schaue ich mal, ob Dall-E ein Bild im Stil von Vermeer erstellen kann.
“An open head showing the brain by Johannes Vermeer”

Hmmm. Das mit dem Hirn hat nicht funktioniert. Johannes Vermeer hat in der Mitte des 17. Jahrhunderts gelebt. Hat Vermeer vielleicht noch nicht so genau gewusst, wie ein Hirn aussieht?
7. Zweifel an meinen Englischkenntnissen
Dann starte ich nochmals einen Versuch mit Vermeer:
“a head with an open skullcap showing the brain inside by Johannes Vermeer”

Gar nicht das, was ich wollte. Als ich mal nachschlage, was “skullcap” auf Deutsch heisst, finde ich heraus, dass es eine Kappe ist. Vielleicht sollte ich an meinen Englischkenntnissen arbeiten.
8. Cyberpunk
Dann sehe ich noch ein Beispielbild im Cyberpunk-Stil. Das interessiert mich und so versuche ich folgenden Text:
“a cyberpunk illustration of an open head with a brain”

Cool! Vor allem das vierte Bild gefällt mir. Doch der Deckel passt nicht wirklich auf den Kopf.
9. Einen Teil neu generieren
Bei Dall-E kann man auch mit dem Radiergummi einen Teil des Bildes auslöschen und nur diesen Teil neu generieren lassen. Also lösche ich den Deckel raus und bemühe die künstliche Intelligenz ein weiteres Mal.

Beim ersten sieht man gar kein Hirn. Das zweite Bild – hä, keine Ahnung, was das war. Beim dritten ist das Hirn zu klein. Das vierte Bild ist genial. Was für ein Hirn! Wie nur kommt Dall-E auf eine solche Visualisierung?
10. Endergebnis
Ich nehme dieses Bild und weil ich für den Blog lieber ein Bild mit Querformat nutze, erweitere ich es mit Photoshop auf beiden Seiten. Das könnte man auch mit Dall-E machen, aber weil ich dort nur eine Farbe möchte, kann ich das ohne künstliche Intelligenz.
Dies ist das Endergebnis, welches ich im Blogeintrag Learning in Public schliesslich verwende:

Dafür habe ich nun einige Versuche benötigt. Aber ich hatte auch einfach Spass und wollte ein paar unterschiedliche Varianten ausprobieren.
Was meinst du zu diesem Bild und zur Verwendung von Dall-E für Blogbilder?