Die Zukunft der Bilder: KI-Bildgeneratoren im Vergleich

KI-Bildgeneratoren

Mica Zeitz
am 31. März 2023
aktualisiert 12. Januar 2025

Inhalt

Einleitung

Schon heftig, was sich in den letzten Jahren im Bereich künstliche Intelligenz (KI) getan hat, allein in den letzten 3 Monaten gab es Schlag auf Schlag News. Sogar gleich soviel, dass aktuell einige Tech-Mogule wie z.B. Elon Musk vor der zu schnellen Optimierung von KI`s warnen und eine sofortige Entwicklungspause fordern. Warum fragen Sie sich?
Was können diese Tools eigentlich?
Nun, nicht nur Chat-GPT ist in aller Munde (oder Browserfenster) sondern auch die KI-Bildgenerierung bzw. Bildbearbeitung ist auf dem Vormarsch und kann bereits heute erstaunliche Ergebnisse liefern. Das geht soweit, dass man ein echtes Foto von KI-generiertem Bild kaum mehr unterscheiden kann.
In diesem Blogartikel stellen wir einige der aktuell besten KI-Bildgeneratoren vor und vergleichen ihre Funktionen und Ergebnisse nach unserem eigenen Wissensstand.
Da sich die KI ständig neu erfindet und sich die Möglichkeiten der Anbieter verändern/erweitern, versuchen wir diesen Blogeintrag immer so aktuell wie möglich zu halten.
Also, los geht´s.
Stand: 31.03.2023

Was ist ein KI-Bildgenerator?

Definition und Funktionsweise – für alle, die davon noch nie gehört haben

Ein KI-Bildgenerator ist ein Tool, das mithilfe von künstlicher Intelligenz Bilder erstellt. Soweit so gut. Im Gegensatz zu echten Fotos werden diese Bilder nicht durch eine Kamera aufgenommen, sondern durch eine Software generiert. Dabei können verschiedene KI-Algorithmen zum Einsatz kommen, die auf verschiedenen Methoden und Technologien basieren.

KI-Bildgeneratoren nutzen ein Netzwerk von künstlichen neuronalen Netzwerken, um Bilder zu generieren. Diese Netzwerke sind in der Lage, große Datenmengen zu analysieren und auf der Grundlage von Mustern und Merkmalen zu lernen, wie ein bestimmtes Bild aussehen sollte. Dies ermöglicht es der Software, Bilder zu erstellen, die den Merkmalen und Strukturen von echten Fotos sehr ähnlich sind.

StrategieVier Wegagentur KI Bilder MidJounrey V5 0018

Einsatzbereiche der KI in der Fotografie

Die Einsatzbereiche der KI in der Fotografie und allen Bereichen, die damit zu tun haben, sind vielfältig. Neben der automatisierten Bildgenerierung, wie bereits erwähnt, kann KI auch zur Bildverbesserung eingesetzt werden. Hierbei können unerwünschte Objekte aus Bildern entfernt, Farben angepasst oder unscharfe Bilder verbessert werden. Auch die automatische Erkennung von Objekten und Personen auf Bildern wird durch KI ermöglicht. Dies ist besonders nützlich für die automatische Verschlagwortung und Kategorisierung von Bildern, um die Suche nach bestimmten Motiven zu erleichtern. Darüber hinaus kann KI auch in der Bildanalyse eingesetzt werden, beispielsweise zur Erkennung von Gesichtsausdrücken oder zur Identifikation von Markenlogos in Bildern. Die Einsatzbereiche von KI in der Fotografie sind somit vielseitig und bieten zahlreiche Möglichkeiten zur Automatisierung und Verbesserung von Bildprozessen.

Die besten KI-Bildgeneratoren auf dem Markt

Es gibt eine Vielzahl von KI-Bildgeneratoren auf dem Markt, aber einige der besten sind MidJourney, Leonardo.ai, Lexica, Dreamlike.art und Adobe Firefly (Beta). Natürlich gibt es zahlreiche weitere Tools, die wir selbst aber noch nicht getestet haben und daher in diesem Vergleich nicht aufgenommen wurden.

Hier eine kurze Übersicht:

MidJourney: läuft über die App Discord, kostenpflichtig, qualitativ sehr hochwertig, viele Möglichkeiten der Einflussnahme, dadurch auch etwas komplizierter in der Bedienung, verschiedene KI-Modelle, bis zu 2048×2048 px
Leonardo.ai: browserbasiert, aktuell mit Warteliste, bedingt kostenlos, bis zu 150 Bilder pro Tag, verschiedene KI-Modelle für unterschiedliche Bildstile, max. 1024×1024 px
-> Besonderheit: AI Canvas: Bilderweiterung auf KI Basis
Lexica: browserbasiert, kostenlos (100 Bilder/Monat), monatliches Abo, sehr wenige Einstellmöglichkeiten, max. 2560×2560 px
Dreamlike.art: browserbasiert, bedingt kostenlos (arbeitet mit credits, die sich nach einer gewissen Zeit immer wieder erneuern, credits zukaufbar), verschiedene KI-Modelle für unterschiedliche Stile, max. 3072x3072px
Adobe Firefly: aktuell in der Beta Version, nur Zugriff mit einer Adobe ID, max. 1024×1024 px, Bilder aktuell mit Wasserzeichen und nicht für den kommerziellen Gebrauch erlaubt

Zum besseren Vergleich, was die jeweiligen KI`s mit ein und dem selben Prompt (= Aufforderung an die KI) machen, finden Sie jeweils immer das Bildergebnis zu diesem Prompt:
„bright minimalistic design livingroom, wood furniture, calm landscape on tv screen, high quality interior, highly detailed, 4k“

HINWEIS: alle gezeigten Bilder haben nicht die volle Auflösung und wurden via JPGMini für die bessere Ladegeschwindigkeit optimiert.

Auf dem Bild ist eine lächelnde Person, die auf einem Stuhl sitzt und beide Daumen nach oben zeigt.

KI-Bilder für deine Website!

Stockfotos waren gestern! Wir erstellen KI-Fotos für deine Website – fotorealistisch genauso wie kreativ-surreal.

Jetzt Beratungstermin vereinbaren

MidJourney: Der vielseitige KI-Bildgenerator

Funktionen und Anwendungsgebiete

MidJourney ist ein KI-Bildgenerator, der sich für die Erstellung von Stock-Foto ähnlichen Motiven sowie surreal wirkenden Bildern eignet. Die Software ist anfangs etwas schwierig zu bedienen, sie läuft über den Dienst Discord, dh. man benötigt zunächst einen Discord-Account und kann sich dann bei MidJourney anmelden und über Discord auf den sogg. MidJourney-Bot zugreifen.
Ausführliche Anleitungen zum Start in MidJourney gibt es bei YouTube zu finden, wie zum Beispiel dieses Erklärvideo.

MidJourney selbst hat eine sehr gute und ausführliche Anleitung, die man sich auch im Browser direkt übersetzten lassen kann.

Da viele der KI-Bildgeneratoren meist aus der Ecke der Spiele- und Fantasydesign-Entwicklung kommen, ist auch MidJourney besonders gut im Bereich von surrealen Figuren, Fantasy-Szenen und machmal sehr künstlich wirkenden Oberflächen.
Seit kurzem ist Version 5 von MidJourney verfügbar, zwar noch nicht in seiner finalen Version, aber das was die KI hier macht, ist einfach Mindblowing. Die Qualität besonders im Bereich der fotorealistischen Bilder ist erstaunlich. Der Verbesserung von V4 auf V5 ist ein Quantensprung und wird den Markt der Stock-Fotos definitiv aufrütteln (nicht ohne Grund verklagt z.B. gerade Getty Images die Macher von KI-Bildgeneratoren -> zum Beitrag auf t3n).

Die Schwächen von MidJourney liegen aktuell in der Bildvergrößerung (Upscaling), da hier, je nach gewählter Upscaling-Version, z.T. die Bilder nochmal ergänzt/verändert werden und so das Endergebnis nicht exakt dem vorher generierten Bild entspricht (dies gilt aktuell für die Version 4, eine Upscaling-Version für die Version 5 ist noch nicht verfügbar).
Aber auch hier gibt es Lösungen, um Bilder mittels KI besser zu vergrößern, hierzu wird es noch einen weiteren Blogartikel geben.

Beispiele für generierte Bilder

Hier finden Sie die Bilder, die MidJourney zu dem oben genannten Prompt erstellt hat:
Version 4:

KI Bilder von MidJourney

StrategieVier Wegagentur KI Bilder MidjourneyV4 0002

Version 5:

StrategieVier Wegagentur KI Bilder MidjourneyV4 0003

StrategieVier Wegagentur KI Bilder MidjourneyV4 0004

Weitere Bilder aus MidJourney Version 5:

StrategieVier Wegagentur KI Bilder MidJounrey V5 0014

StrategieVier Wegagentur KI Bilder MidJounrey V5 0015

Fazit

MidJourney ist unserer Meinung nach eins der KI-Bildtools mit den besten Bildergebnissen. In der Version 5 achtet die KI auch noch gezielter auf die Aufforderungen der Nutzer und interpretiert weniger von ihrem eigenen Stil hinein. Dadurch wird die KI besser kontrollierbar und mehr und mehr als richtiges Arbeitstool nutzbar. Die Usability könnte noch verbessert werden, da man sich erst einlesen und lernen muss, wie die KI mit verschiedenen Prompts und zusätzlichen Parametern umgeht.
Ein Vorteil der vielen Optionen liegt aber klar auf der Hand: je genauer und geplanter man an die Prompts rangeht, desto schneller kommt man an sein Ziel.

Wichtigste Infos im Überblick

nach Probezeit kostenpflichtig (ab 8$/Monat)
nutzbar via Discord (dadurch auch auf dem Handy verwendbar)
Maximale Auflösung: V4 2048x2048px, V5 aktuell nur bis 1024x1024px
viele Einstellmöglichkeiten
hohe Einflussmöglichkeit ab V5
seit V5 Seitenverhältnisse größer als 1:2
eigene Bilder hochladbar (Bild-Text-Prompt, Bild-Bild-Prompt)

Leonardo.ai: Der professionelle KI-Bildgenerator

Funktionen und Anwendungsgebiete

In Leonardo.ai kommt man aktuell nur per Warteliste rein, dh. man meldet sich auf der Webseite an und wartet dann ca. 4-5 Tage und wird anschließend freigeschaltet.
Leonardo ist browserbasiert und somit von der Bedienung leichter als MidJourney, es gibt auch hier Parameter, die man anpassen kann und verschiedene KI-Modelle, dh. je nachdem welchen Stil man generieren möchte, wählt man das passende Modell dazu aus.

StrategieVier Wegagentur KI Bilder Leonardo AI 0010 — Leonardo.ai: verschiedene KI-Modelle zur Auswahl für unterschiedliche Anwendungsfälle

Pro Tag hat der User 250 Tokens frei. Je nachdem was man generiert und auch in welcher Auflösung werden Tokens abgezogen.
Leonardo hat verschiedene Einstellmöglichkeiten: Seitenverhältnis, Auflösung, die Gewichtung des Prompts, Anzahl der Bilder. Ebenso hat man die Wahl aus verschiedenen KI-Modellen, je nachdem welchen Bildstil man wünscht. Aktuell liegen hier die Prioritäten bei kreativen, fantasybasierten Stilen, komplett fotorealistische Modell sind noch nicht vorhanden.

Eine Besonderheit bei Leonardo.ai ist die sich noch in der Beta befindenen AI Canva Funktion: mit diesem Tool lassen sich Bilder an den Seiten erweitern und somit vergrößern.

StrategieVier Wegagentur KI Bilder Leonardo AI 0012 — AI Canva: Erweiterung eines Fotos/Bildes an den Seiten mittels KI

Beispiele für generierte Bilder

Als Beispiel, wie die Modelle arbeiten finden Sie hier ein und denselben Prompt mit unterschiedlichen KI-Modellen:

StrategieVier Wegagentur KI Bilder Leonardo AI 0005 — Leonardo Select: realistisch, wirkt aber noch sehr computergeneriert

StrategieVier Wegagentur KI Bilder Leonardo AI 0006 — Leonardo Signature: wirkt wesentlich echter, allerdings sind 2-3 TVs eher ungewöhnlich 😉

StrategieVier Wegagentur KI Bilder Leonardo AI 0007 — Leonardo Diffusion: sehr düster und kühl, zu perfekte Oberflächen

StrategieVier Wegagentur KI Bilder Leonardo AI 0008 — Leonardo Creative: sieht extrem nach Gaming aus, dieses Modell passt nicht für Interoir-Design Bilder

StrategieVier Wegagentur KI Bilder Leonardo AI 0009 — Leonardo Signature vergrößert

Fazit

Leonardo.ai ist ein sehr leistungsstarkes KI-Bild-Tool mit vielen Möglichkeiten. Die verschiednen KI-Modelle können am Anfang etwas verwirren, wenn man sich aber mehr damit beschäftigt, findet man sich zurecht. Es gibt weniger „Einstellmöglichkeiten“ als bei MidJourney, das Tool ist aber dafür auch einfacher zu bedienen.

Wichtigste Infos im Überblick

browserbasiert, sehr übersichtlich in der Bedienung
kostenlos benutzbar (beschränkt auf 250 tokens/Tag)
Maximale Auflösung: 1536×1536 px
verschiedene KI-Modelle stehen zur Auswahl
Im Vergleich zu MJ V5: Bilder wirken oft zu glatt und perfekt, zu „computergeneriert“
im Fantasy-Bereich sehr gut
eigene Bilder als Vorlage hochladbar

Auf dem Bild ist eine lächelnde Person, die auf einem Stuhl sitzt und beide Daumen nach oben zeigt.

KI-Bilder für deine Website!

Stockfotos waren gestern! Wir erstellen KI-Fotos für deine Website – fotorealistisch genauso wie kreativ-surreal.

Jetzt Beratungstermin vereinbaren

Dreamlike.art: Der surreale KI-Bildgenerator mit Extra

Funktionen und Anwendungsgebiete

Dreamlike.Art ist eine weitere KI-Bildgenerierungsplattform, die es Benutzern ermöglicht, Fotos und Bilder mit surrealen Elementen zu erstellen. Die Plattform basiert auf der GAN-Technologie und nutzt eine große Sammlung von Bildern, um neue Bilder zu generieren, die in einem ähnlichen Stil wie die Vorlagen sind. Benutzer können ihre eigenen Bilder hochladen und die KI verwenden, um surreale Effekte hinzuzufügen oder vollständig neue Bilder zu generieren.
Dreamlike.Art ist recht einfach zu bedienen und bietet eine Vielzahl von Optionen für die Erstellung von surrealen und künstlerischen Bildern. Im Advanced-Mode gibt es noch zahlreiche weitere Einstellmöglichkeiten.
Auch Dreamlike.art hat 4 verschiedene KI-Modelle zur Auswahl für verschiedene Stile.

Besonderheit bei Dreamlike.art ist der „Enhance“-Mode: hier kann man ein eigenes Bild (muss nicht von Dreamlike.art generiert worden sein) hochladen und dieses vergrößern lassen (= die Auflösung durch KI erhöhen), und das funktioniert echt erstaunlich gut.

Beispiele für generierte Bilder

Hier sehen Sie Bilder, die Dremalike.art zu oben genanntem Prompt erzeugt hat:

StrategieVier Wegagentur KI Bilder Dreamline Art 0020

StrategieVier Wegagentur KI Bilder Dreamline Art 0021 — Dreamlike.art: sehr korrekte Ausführung der Vorgabe, sieht noch sehr „perfekt“ aus

Fazit

Wichtigste Infos im Überblick

mächtige KI mit vielen Einstellmöglichkeiten und Advanced Mode
bedingt kostenlos (50 Credits/Tag, zukaufbar)
Maximale Auflösung: 1152×1152 px
Enhance-Mode: Upscaling von Bildern bis 4096x4096px
viele Einstellmöglichkeiten

Lexica.art: der einfache KI-Bildgenerator

Funktionen und Anwendungsgebiete

Lexica ist in seiner Bedienung das einfachste der vorgestellten Tools. Account erstellen und los gehts. Das Ganze ist kostenlos und man hat auch nur wenige Einstellmöglichkeiten.
Lediglich den Prompt, einen Negativ-Prompt, also Inhalte, die man nicht im Bild haben will, das Seitenverhältnis und die sogg. „Orientierungsskala“ kann eingegeben bzw. angepasst werden.
Auch die Anfangsauflösung liegt bei 640x640px im Quadrat, kann aber anschließen hochskaliert werden auf bis zu 2560x2560px.
Auch gibt es die Funktion „Outpaint“, sprich Bilderweiterung. So wird aus einer Normalbrennweite ein Weitwinkelbild. Leider sind hier die Ergebnisse noch nicht immer so ganz akurat.
Für einfache Motive, die durchaus gerendert aussehen dürfen, ist Lexica eine gute Wahl, auch um sich in dem Thema KI-Bildgenerierung auszuprobieren ohne von komplizierten Einstellmöglichkeiten erschlagen zu werden.

Beispiele für generierte Bilder

StrategieVier KI Bilder

StrategieVier KI Bilder

Hier das gleiche Bild mit der „outpaint“ Funktion:

StrategieVier KI Bilder Lexica003 2

Weitere Motive:

StrategieVier KI Bilder

StrategieVier KI Bilder

Fazit

Die Stärke von Lexica liegt in der Bedienung – einfach, schnell und unkompliziert. Die Ergebnisse sind aber zum Teil leider etwas ernüchternd im Vergleich zu anderen KIs. Letztlich muss man sich ein wenig durchtesten, welcher Bildstil und „Generierungsstil“ einem gefällt.

Wichtigste Infos im Überblick

sehr einfach zu bedienen
hohe Endauflösung
sehr cleane und „perfekte“ Bilder
Maximal Auflösung: 2560x2560px
100 Bilder pro Monat frei, danach monatliche Kosten
spannende Outpaint Funktion
wenig Einstellmöglichkeiten

Adobe Firefly (Beta): der Alleskönner (bald hoffentlich 😉 )

Funktionen und Anwendungsbereiche

Zu Adobe Firefly habe ich erst ganz frisch Zugriff erhalten und kann daher noch keine ausführlichen Testergebnisse liefern.
Aber eines kann ich verraten: es wird mächtig und kann nicht nur Bilder generieren (Text-to-Image). Adobe ist ja bekannt für seine Grafikfunktionen, und so bieten sie mit Firefly auch jede Menge mehr Möglichkeiten:

Text-to-Image
Text-Effekte
Vektoren neu einfärben (coming soon)
Malen (coming soon)
Personalisierte Ergebnisse (coming soon)
Text zu Vektor (coming soon)
Bild erweitern (coming soon)
3D zum Bild (coming soon)
Text zum Muster (coming soon)
Text zum Pinseln (coming soon)
Skizze zum Bild (coming soon)
Text zur Vorlage (coming soon)

Man sieht schon: da ist einiges in der Entwicklung, was sich vielversprechend anhört.
Die Text-to-Image Funktionalität ist recht einfach zu bedienen, Prompt eingeben und anschließend die gewünschten Parameter einstellen, die 4 Bilder zur Auswahl werden dann immer wieder angepasst, je nachdem, welches Format, welchen Stil oder auch Lichtsetting man ausgewählt hat.
Es gibt einige Möglichkeiten an vordefinierten Settings, natürlich kann man aber auch den Prompt ausführlicher schreiben. Allerdings nur auf Englisch.
Für welchen Einsatzzweck Firefly geeinget ist, kann man so pauschal nicht sagen, da es eine Vielzahl an Möglichkeiten bietet bzw. bieten wird.
Die Bildergebnisse können sich sehen lassen, kommen aber aktuell bei photorealistischen Bildern noch nicht an MidJourney ran.

Aktueller Nachteil der Beta Version: jedes Bild erhält beim Download ein Wasserzeichen, auch sind die Bilder noch nicht für kommerzielle Zwecke freigegeben.
Ebenso ist das Prompt Feld auf eine gewisse Anzahl an Zeichen limitiert, was sehr ausführliche Beschreibungen einschränkt.

Beispiele für generierte Bilder

StrategieVier KI Bilder AdobeFirefly 001

StrategieVier KI Bilder AdobeFirefly 005

StrategieVier KI Bilder AdobeFirefly 006

StrategieVier KI Bilder AdobeFirefly 004

Hier folgt noch ein Beispiel für die Text-Effekt Funktion:

StrategieVier KI Bilder AdobeFirefly 008

Fazit

Adobe Firefly ergänzt den bereits stark umkämpften Markt der KI-Bildgeneratoren vor allem durch seine aktuell noch nicht verfügbaren Optionen, besonders im Bereich Grafik, Vektoren und ebenenbasierten Bildgenerierung. Dies scheint sehr vielversprechend zu werden und wir sind gespannt, Ihnen hier bald ein Update geben zu können.

Wichtigste Infos im Überblick

aktuell nur 2 Funktionen: Text-to-Image, Text-Effekte
nur 4 Seitenverhältnisse
Wasserzeichen auf Bildern, geringe Auflösung
(noch) nicht für kommerzielle Zwecke freigegeben
Zugang nur im Beta-Bereich, nur mit Adobe-ID
keine automatische Speicherung des Verlaufs, dh. man kann nicht mehr auf die generierten Bilder zugreifen, außer man hat diese gespeichert
verschiedene Stile direkt auf den gleichen Prompt anwendbar

Mehr über mich:

Mica Zeitz

Mica Zeitz ist S4-Mitgründerin. Als gelernte Fotografenmeisterin setzt sie die Firmenarchitektur und Produkte unserer Kunden ins perfekte Licht – natürlich perfekt abgestimmt auf das Webdesign. „Aber ich bin doch nicht fotogen“ lässt sie übrigens nicht gelten. Für Businesspotraits animiert Mica mit ihrer offenen Art auch den scheuesten Charakter zu authentischen Bildern.

Eine lächelnde Person sitzt auf dem Boden und hält eine Kamera. Mica Zeitz

Weitere Beiträge von uns

Businessfotos mit KI erstellen lassen – sinnvoll oder nicht?

Mica Zeitz
Content, Künstliche Intelligenz (KI)

Erfahre wo KI für Businessfotos sinnvoll ist - und wo nicht. Wo liegen die Grenzen der KI-Bildgeneratoren und worauf musst du bei Nutzung von KI-Bildern achten....