Mit KI Bilder generieren für Blog-Artikel

, , , ,

Mit KI Bilder für Blog-Artikel generieren könnte eine Alternative zu den immergleichen Stock-Illustrationen und erst Recht zur ewig-alten Abmahngefahr sein. Deshalb testen viele Blogger derzeit KI-Bild-Generatoren wie Adobe Firefly, DALL-E3, Stable Diffusion oder Midjourney. Sie sammeln erste Erfahrungen oder setzen solche Werkzeuge auch bereits produktiv ein.

KI-Bild-Generatoren machen viele Photographen über kurz oder lang arbeitslos

Auch ich sammle seit ein paar Monaten erste Erfahrungen mit einigen solchen Werkzeugen, beobachte den Markt und tausche mich mit anderen Anwendern über deren Erfahrungen aus. Und ich bin überzeugt: KI-Bild-Generatoren werden in vielen Einsatzbereichen den klassischen Stock-Vermarkten den Todes-Stoß versetzen. Oder um genauer zu sein: KI-Bild-Professionals werden vielen professionellen und semiprofessionellen Photographen die ökonomische Basis entziehen. In der Photographie mag sich die Event-Photographie behaupten. Ein Hoch den Hochzeitsphotographen und der Live-Reportage aus der Geburtsklinik. Die künstlerische Themen-Photographie aber, die von der Vermarktung über Agenturen bislang so einigermaßen leben konnte, wird zu den ersten Arbeitsmarktopfern der Künstlichen Intelligenz zählen.

Adobe weiß mal wieder, wohin der Photo-Hase läuft

Adobe weiß mal wieder besser als viele andere, wohin der Photo-Hase läuft. Kaum hat der Software-Gigant Microsoft sich angeschickt seine teuer eingekaufte geballte KI-Kompetenz auch für die Zwecke der Bildproduktion einzuspannen und mit der Integration von DALL-E3 in seine Suchmaschine Bing gezeigt, was man mit Künstlicher Intelligenz im Bereich Bildproduktion alles machen kann, hat Adobe erkannt, dass Microsoft mit seiner Marktmacht in Verbindung mit guten Produkten für das eigene Unternehmen sehr gefährlich werden kann. Ich habe zum Beispiel in den letzten Jahren fast alle meine Beiträge für meinen Czyslansky-Blog und für diverse Blogs von Kunden und Partnern wie Leschaco, itl, den Flughafen München oder die Butler-Schule BCM mit Stock-Material von Adobe illustriert. Adobe-Stock-Bilder finden sich auch hier auf dem Blog von vibrio regelmäßig. In den letzten Wochen schmuggelten sich aber immer häufiger mit KI erstellte Titelbilder in meine Artikel. Das Tool der Wahl war zumeist DALL-E3. Ein paar Beispiele gefällig? Gerne:

Albert Einstein

Der schlafende Albert Einstein illustrierte zum Beispiel einen Beitrag über Powernapping aus Anlass der Vorstellung des Buches „Der wache Vogel fängt den Wurm“ von Markus Kamps und Kathrin Leinweber im Münchner Presseclub. Die Illustration passte ganz wunderbar: Albert Einstein war ein bekannter „Powernapper“, also jemand, der bekannt dafür war, dass er sich gerne mal „zwischendurch“ seine Erholungspausen gönnte und einfach mal für eine halbe Stunde „aufs Ohr haute“. Das fand im Blogbeitrag eine Erwähnung. Einen schlafenden Einstein werden sie aber nirgendwo in den Bildarchiven finden. Und der bekannte Einstein mit der herausgereckten Zunge hilft da nicht weiter, – ganz abgesehen von den problematischen Bildrechten. Mit DALL-E3 konnte ich den Herrn mal eben auf die Couch legen.

Das klappte übrigens nur, weil Einstein schon tot ist. Microsoft hat seinem KI-Tool nämlich beigebracht, dass es Bildkompositionen mit lebenden Personen nicht zulässt. Dies soll die Persönlichkeitsrechte der abgebildeten Personen schützen. Gut so. Die KI-Fakes vom Trump im Polizeigriff haben wir doch alle noch in Erinnerung. Ob wir wollen oder nicht, wir müssen zwischen Wunsch und Wirklichkeit unterscheiden …

Das gilt auch für den Weihnachtsmann:

Der Whisky-trinkende Weihnachtsmann, ebenfalls mit DALL-E3 ertrunken und erlogen, illustrierte meine kleine Verkostungsserie zum Whisky-Adventskalender 2023.

Aber DALL-E3 kann nicht nur Männer erschaffen, sondern natürlich auch Frauen. Und wenn man sich in den einschlägigen Communities der KI-Bild-Kreationisten bewegt, stellt man schnell fest, dass sogar überwiegend Frauen mit KI „gebaut“ werden. Wobei das Frauenbild – leider – ein recht überkommen sexistisches ist und es ganz offenbar vor allem Männer sind, die sich mit KI ihre „Weibs-Bilder“ mit Alptraummaßen erzeugen.

Ich habe mit DALL-E3 immerhin mal eine virtuelle Butlerin gezeugt, weil der Butler-Beruf in den klassischen Stock-Sammlungen arg Männer-dominiert ist, während der Blog-Beitrag meiner wunderbaren Kollegin Valerie Neher doch genau davon handelte, dass weibliche Butler – also „Butlerinnen“ – in der realen Welt weit verbreitet sind. Für ein Photo-Shooting war keine Zeit und das verfügbare Stock-Material war schon verbraucht, also griff ich zu DALL-E3, und da war sie, die Butlerin zum Blog-Artikel:

All diese Menschenbilder wurden also mit Technologie von Microsoft geschaffen, ganz ohne die Bilder-Profis von Adobe. Das musste Adobe natürlich auf den Plan rufen. Und siehe da, Adobe reagierte, und zwar mit der ganzen kreativen und technologischen Kompetenz des Marktführers im Markt für Bildbearbeitungssoftware: mit der Einführung von Adobe Firefly!

Adobe Firefly – das Glühwürmchen in dunkler Nacht

Adobe hat Firefly (deutsch: „Glühwürmchen“) schon im Sommer 2023 vorgestellt. Es ist ein eigenständiger generativer AI-Bild-Generator, der in die Produktpalette von Adobe eingebunden ist, also mit Software wie Photoshop, Adobe Stock oder Illustrator „seamless“ funktioniert. Und um es gleich zu sagen: Adobe Firefly ist meine Empfehlung unter den heute vorhandenen AI-Bild-Generatoren für alle kreativen Blogger zur Erstellung von üblichen Blog-Illustrationen.

Man kann mit diesem Tool nach meiner Meinung rund 90 Prozent der Einsatzzwecke, die in Blogs vorkommen, abdecken. Der vielleicht größte Vorteil für Blogger ist die einfache Bedienbarkeit. Schließlich leben die meisten Blogger von ihren Texten, nicht von ihren Bildern. Bilder sind wichtige Elemente zur Illustration. Sie begleiten den Text, erleichtern die Auffindbarkeit, die Verständlichkeit und erhöhen die Akzeptanz. Ich rede hier also nicht von Photo-Blogs oder Blogs, die in ihrem Kern Photo-Stories erzählen.

Was kann man mit Adobe Firefly machen? Viel:

Der wichtigste Einsatzzweck ist sicherlich die Entwicklung von Bildern aus Text. Dazu genügt es, das Bild, das entworfen werden soll, mit einigen Worten zu beschreiben. Diese Beschreibung wird bei KI-Bild-Generatoren „Prompt“ genannt. Ein solcher Prompt kann zum Beispiel lauten „Blick über die Schuler einer jungen blonden europäischen Frau, die auf einen Stadtplan schaut“. Ich suchte vor ein paar Tagen eine solche Illustration für eine Vortragsfolie mit dem Thema „Von der Storyline zum Kommunikationsplan“.

Adobe Firefly zeigt gleich nach der Eingabe des Prompts schon mal erste Entwürfe an, mit denen man noch nicht wirklich zufrieden sein wird. Man kann aber auch noch einige Kriterien angeben:

  • Das gewünschte Seitenverhältnis
  • Ob man ein Foto oder ein künstlerisches Artwork wünscht
  • Effekte, wie zum Beispiel Irisierende oder Neon-Effekte
  • Farbeffekte, wie zum Beispiel Pastelltöne, kühle oder warme Farben
  • Beleuchtungseffekte, wie zum Beispiel Studiobeleuchtung oder gegenlicht
  • Perspektiven, wie zum Beispiel Nachaufnahme oder Weitwinkel
  • Blendenwerte und Verschluss für den Unschärfeverlauf
  • Sichtfeld (also den Zoom-Wert bzw. das Objektiv)

Und seit kurzem kann man sogar ein Musterbild als Stilvorlage hochladen, so dass man ganze Foto-Serien mit einheitlicher Bild-Stimmung erzeugen kann. Adobe nennt das „Generative Match“ (https://blog.adobe.com/de/publish/2023/10/10/verwendet-firefly-generative-match-um-bilder-in-eurem-stil-zu-erzeugen)

Mit dem Prompt muss man trotzdem experimentieren, vielleicht noch einige Adjektive hinzufügen, einfach das Bild optimal beschreiben, so dass es die KI „versteht“. So habe ich zum Beispiel das Adjektiv „europäisch“ eingefügt, weil ich für den Vortrag explizit eine hellhäufige Frau benötigte. Und man wird sich einige Foto-Alternativen generieren lassen, weil das Programm einige Angaben partout nicht verstehen will. Im Beispiel war es bei der Stadtplan-lesenden Frau kaum möglich dem Glühwürmchen beizubringen was ich mit „Blick über die Schulter“ meinte. Erst nach mehreren Versuchen schaute das Glühwürmchen wirklich der Frau über die Schulter auf den Plan. Dann aber machte das Programm noch immer manches Mal eigenartige Dinge. Mal wieder ein Beispiel gefällig? Gerne:

Bemerken Sie den Fehler? Beim Versuch über Adobe Firefly die Orientierung zu gewinnen wird sich diese Frau wohl schwer tun. Ein bisschen ist das wie mit dem Diercke Weltatlas durch Schwabing navigieren …

Aber irgendwann hatte ich dann doch noch ein recht brauchbares Foto generiert:

Noch machen die KI-Bild-Generatoren viele Fehler

Der Bau von KI-Bildern kann ganz schön lustig sein. Die Generatoren – und Firefly ist da keine Ausnahme – treiben es manches Mal ganz schön bunt. Für einen Nachruf auf Franz Beckenbauer suchte ich nach einem Fußballer in einer Messehalle. Der Hintergrund: Ich hatte mal ein längeres Zusammentreffen mit Beckenbauer auf der CeBIT. Eine schöne Geschichte, die es wert war, erzählt zu werden. Also wies ich Adobes Feuerfliege an mir ein Titelbild zu generieren. Fotos mit Franz Beckenbauer generiert Adobe nicht. Also versuchte ich den Prompt „ein Fußballspieler im Fußballtrikot von hinten zwischen mehreren Geschäftsleuten von hinten in einer Messehalle“. Das Ergebnis war erschütternd:

Erst nach einigen Mühen gelang mir dann folgendes Bild:

In den einschlägigen Communities tauschen KI-Bildbauer gerne Fehlproduktionen ihrer KI-Bilder aus, so wie früher Briefmarkensammler seltene Fehldrucke ihrer Briefmarken zum Tausch anboten. Besonders beliebt sind sogenannte „Dreibeine“, also dreibeinige Models. Wobei in Facebook-Gruppen wie midjourney.unofficial eher die dreibrüstige Aua aus Günter Grass Der Butt zum Leben erweckt wird.

Zwei weitere Beispiele für Blog-Titel-Illustrationen mit Adobe Firefly

Trotz zahlreicher Fehlversuche gelingt es mit ein wenig Übung und Geduld recht schnell mit Adobe Firefly recht brauchbare Illustrationen für Vorträge und Blog-Artikel zu generieren. Hier noch zwei kleine Beispiele aus Beiträgen für den Gefahrgut-Logistik-Blog, den wir für unseren Kunden Leschaco betreuen:

Die Containerschiffe hinter dem digitalen Steuerungs-Board und den virtuellen Kennzeichen der digitalen Welt waren das Titelbild eines Blog-Beitrags zur Digitalisierung in der Logistik.

Im gleichen Blog erschien auch dieses Bild für einen Beitrag über das sichere Handling gefährlicher Güter im Alltag. In den üblichen Galerien mit Stock-Bildern gab es einfach keine nette Frau mit einer Sammlung von Feuerwerkskörpern und Reinigungschemikalien, die den Beitrag vernünftig illustriert hätte. Einen Putztrupp wollte ich nicht ablichten. Das hätte das Thema zu sehr auf eine professionelle Zielgruppe verschoben.

Adobe Firefly kann aber noch mehr

Adobe Firefly kann aber nicht nur Fotos erzeugen, es kann auch Fotos manipulieren. Für Bildbearbeiter interessant ist zum Beispiel die Funktion „Generative Füllung“. Diese Funktion steht sowohl im Stand-Alone-Produkt Firefly, als auch integriert in Photoshop zur Verfügung. Hierzu wird in einem vorhandenen Bild ein Bereich markiert und dieser Bereich anschließend generativ mittels Prompt gefüllt.
Ich habe für diesen Artikel mal ein kleines Beispiel auf die Schnelle gebaut.

Die Bildvorlage habe ich vor zwei Jahren in Santa Margherita photographiert:

Über den Befehl „Generative Füllung“ in Adobe Firefly habe ich den Gehweg links von der roten Vespa mal eben in fünf Minuten mit Wasser geflutet:

Ich habe das Bild für dieses Beispiel nicht weiter bearbeitet.

Eine weitere Funktion in Firefly sind Text-Effekte. Damit kann man Buchstaben bzw. Texte mit Texturen belegen. Weitere Funktionen betreffen das Anlegen von Vektorgrafiken aus Prompts und das Einfärben von Vektorgrafiken und das Anlegen von Vorlagen, die man zum Beispiel für Karten oder ähnliches verwenden kann. Es gibt weitere zahlreiche Möglichkeiten Bilder zu manipulieren, Features, die Bildbearbeiter zum teil aus Photoshop kennen, bzw. die den neuen KI-Funktionen in Photoshop entsprechen.

Adobe Firefly und Photoshop

Adobe Flrefly ist derzeit kostenlos. Es bietet zahlreiche vollautomatische Funktionen und ist zugleich in seinen Funktionen zur professionellen Weiterbearbeitung arg beschränkt. Wer wirklich hochwertige Ergebnisse benötigt, der braucht einen langen Atem oder Photoshop in Ergänzung und auch die Fertigkeiten mit Photoshop umgehen zu können. Am Beispiel des italienischen Motorrollers sieht man das: schnell ist ein nettes Bildchen produziert. Aber an die Qualität einer aufwändigen Retusche kommt das Ergebnis nicht heran.

  • Firefly enthält also wesentliche KI-Funktionen aus dem aktuellen Photoshop, die die Arbeit der Retusche für den fortgeschrittenen Photoshop-Anwender beschleunigen.
  • Firefly erlaubt dem Amateur deshalb das schnelle Erzeugen netter KI-Bildchen ohne Photoshop-Retuschen.
  • Vor allem aber erlaubt Firefly heute schon dem Blogger relativ schnell kostenlos die Erzeugung von brauchbaren Illustrationen für seine Textbeiträge in Blogs.

Wem gehört das Copyright?

So bleibt am Ende nur noch eine wichtige Frage: Wem gehört das Copyright an den mit KI generierten Bildern? Diese Frage ist heikel. Urheberrechtsfragen sind international durchaus unterschiedlich geregelt. Und durch das Aufkommen der KI in der Produktion visueller Inhalte besteht derzeit ein enormer Handlungsdruck im nationalen und internationalen Urheberrecht. Aber man kann doch einige Grundregeln klar formulieren:

Grundsätzlich besagt das internationale Urheberrecht, dass man nicht eine Idee urheberrechtlich schützen kann, sondern immer nur die Ausformung einer Idee, als konkreten Content, die Vergegenständlichung der Idee. Schützenswert ist ein Bild, nicht die Bildidee. Der Prompt aber ist die Formulierung der Bildidee. Was aus dem Prompt entsteht, ist das Ergebnis der KI. Der Nutzer der KI kann also kein Urheberrecht an einem Bild geltend machen, das durch einen KI-Bild-Generator erzeugt wurde. Urheberrechte können aber auch nur von natürlichen Personen geltend gemacht werden, nicht von einer KI. Deshalb sind KI-erzeugte Bilder „gemeinfrei“, also nicht geschützt. Freiwillige Transparenzregeln sollten nun den Erzeuger eines KI-generierten Bildes dazu bewegen anzuzeigen, dass das Bild mittels KI erzeugt wurde. Ein Akt der Fairness wäre es demnach bei einer fortgesetzten Nutzung auf die Quelle zu verweisen. Auch kann natürlich ein gemeinfreies Werk vermarktet werden.

Ein solches Werk kann auch nachträglich durch Veränderung bzw. Veredelung wieder einen Schutzstatus erhalten. Allerdings muss diese Bearbeitung ein eigenständiger kreativer Akt sein und diese Änderung – etwa durch eine Bearbeitung in Photoshop – muss nachweisbar sein und erheblich sein.

Sie sehen: die Grauzone ist breit und tief. Und so findet man heute auch in Bild-Stock-Datenbanken eine Vielzahl von Bildern, die ganz offensichtlich mit KI-Tools erzeugt und mit falschen Urheberrechtsangaben versehen wurden. Ein weites Feld für Abmahnanwälte. Bloggern kann man da nur raten: Macht einen weiten Bogen und baut Euch Eure Illustrationen selbst, zum Beispiel mit Adobe Firefly. Weist darauf hin und erhebt erst gar keinen Anspruch auf Copyrights. Freut Euch einfach an schönen Bildern und habt Spaß mit dieser neuen Art von Software.

Titelbild: „Comic: ein Hase mit grauem Hut, schwarzem T-Shirt und Fotoapparat rennt über eine Wiese“. Generiert mit Adobe Firefly von Michael Kausch am 20.01.2024. Alle anderen Illustrationen Michael Kausch unter Nutzung von KI, zum Teil DALL-E3, zum Teil Adobe Firefly.

3 Kommentare
  1. Avatar
    Christian says:

    Danke für den interessanten Beitrag! Eine Frage: Bei Dall-E gelingt es mir nur, quadratische Bilder zu erzeugen. Deine Beispielbilder sind im Querformat. Konntest du sie so generieren (wie?) oder hast du sie nachträglich zugeschnitten?

  2. Avatar
    Michael Kausch says:

    Hallo Christian,
    ich passe das Format immer nachträglich an das vom Blog erwartete Ausgangsformat an. In der Regel mit Photoshop. Und falls notwendig nehme ich in Photoshop auch noch weitere Anpassungen vor. In DALL-E3 kann man aber auch Bilder im Quer- und Hochformat erzeugen. Das geht aber nur über einen bezahlten ChatGPT-Plus-Account, also nicht mit der kostenlosen DALL-Variante, die in Microsoft-Bing enthalten ist. Aber auch die kostenpflichtige Version erlaubt keine exakten Formatangaben. Man kommt also um eine Nachbearbeitung nicht herum.

  3. Avatar
    Antonia says:

    Danke für den interessanten und unterhaltsamen Beitrag! Besonders deine Ausführungen zum Thema Copyright sind hilfreich, um einen kleinen Überblick über diese, wie du schon sagtest, tiefe Grauzone zu erhalten.
    Bisher habe ich schon Erfahrungen mit DALL-E und Midjourney machen können. Beide haben ihre Vor- und Nachteile. Trotzdem finde ich es immer wieder erstaunlich, welche Ergebnisbilder konstruiert werden können!

    Viele Grüße
    Antonia

Dein Kommentar

Want to join the discussion?
Feel free to contribute!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

I accept that my given data and my IP address is sent to a server in the USA only for the purpose of spam prevention through the Akismet program.More information on Akismet and GDPR.