Was ist Flux?
Flux ist zum aktuellen Zeitpunkt noch Open Source und wird von Black Forest Labs entwickelt. Black Forest Labs ist ebenso das ursprüngliche Team, welches hinter der Bilder-KI Stable Diffusion steckt.
Flux wurde am 1. August 2024 veröffentlicht und überzeugt mit hervorragender Qualität sowie der Möglichkeit, fehlerfreie Texte auf KI-generierten Bildern zu erstellen. Dieses KI-Modell zur Bildgenerierung gibt es aktuell in drei verschiedenen Ausführungen:
- Flux.1 [pro]: Das leistungsstärkste Modell, welches aktuell nur über eine API verfügbar ist und nicht für kommerzielle Anwendungen gedacht ist.
- Flux.1 [dev]: Open-Weight-Modell für nicht-kommerzielle Anwendungen mit ähnlichen Eigenschaften wie die Flux.1 Pro.
- Flux.1 [schnell]: Das schnellste Modell, welches bereits hochwertige Bilder mit nur 1 bis 4 Sampling-Schritten erstellt. Läuft unter einer Apache 2.0 Lizenz, wodurch eine kommerzielle Nutzung erlaubt wird.
Flux verspricht hohe Bildqualität und übertrifft laut Black Forest Labs KI-Bilder-Modelle wie Midjourney v6.0 sowie DALL-E 3. Hier findest du weitere Informationen über Black Forest Labs und Flux.
Wie kann man Flux nutzen?
Es gibt drei Möglichkeiten, wie man mit Flux Bilder erstellen kann:
- Über die API des Herstellers
- Den Quellcode lokal installieren
- Über einen leistungsfähigen KI-Bildgenerator
Die erste und zweite Möglichkeit sind wesentlich aufwändiger. Bei der zweiten Möglichkeit benötigt man auch eine sehr gute Grafikkarte. Andernfalls kann man keine Bilder lokal erstellen. Ich habe die dritte Variante gewählt und alle Bilder mit dem KI-Bildgenerator Supermachine erstellt.

In meinem Supermachine Tutorial auf YouTube erkläre ich dir Schritt-für-Schritt, wie du mit Supermachine Bilder erstellen kannst. Alternativ kannst du dir auch meinen Erfahrungsbericht über Supermachine anschauen. Beispielsweise habe ich das folgende Bild in Supermachine mit Hilfe von Flux erstellt:

Dieses Bild hebt nochmal hervor, dass das Erstellen von KI-Bildern mit Text mittlerweile kein Problem mehr ist. Anders sieht es bei Midjourney und Stable Diffusion aus. Dort ist das Erstellen von KI-Bildern mit Texten oft problematisch.
Ist Flux besser als Midjourney und Stable Diffusion?
Flux ist um ein Vielfaches besser, wenn man fehlerfreie Texte auf KI-generierten Bildern darstellen möchte. Verallgemeinert kann man sagen, dass die Bildqualität sowie der ELO-Score der Flux-Modelle im oberen Bereich liegt. Das bestätigt auch der Test von Black Forest Labs:

Hier kann man erkennen, dass das relative Skill-Level der Pro- und Dev-Variante am höchsten ist. Anschließend kommen SD-3Ultra, Ideogram und Flux.1 Schnell.
Des Weiteren ist Flux besser in der Lage, einen Prompt zu verstehen. Das bedeutet, dass man mit einfachen Beschreibungen sehr gute KI-Bilder erstellen kann. Bei anderen Modellen von SDXL muss man oftmals kryptische Trigger-Wörter verwenden, die das Erstellen von Bildern für den Laien erschweren.
Flux: KI-Bilder mit Text erstellen
In meinen vorherigen Artikeln habe ich gezeigt, wie man mit Hilfe von ChatGPT KI-Bilder mit Texten erstellen kann. Leider funktioniert diese Variante nur sporadisch und erfordert in der Regel viel Zeit und vor allem viele Versuche.
Flux eignet sich wesentlich besser für das Erstellen von KI-Bildern mit Text. Die folgenden Bilder habe ich innerhalb weniger Minuten mit Supermachine erstellt. Ich habe für die Texte lediglich in der Prompt den jeweiligen Text in Anführungszeichen eingetragen. Das hat bereits ausgereicht, um fehlerfreie Texte zu generieren.




Diese Bilder zeigen, dass sich das Flux Modell sogar für das Erstellen von Logos mit Hilfe von KI eignen.
KI-Beispielbilder von Flux
Alle der folgenden Bilder habe ich in Supermachine mit dem KI-Bilder-Modell Flux erstellt. Du findest unter jedem KI-Bild die entsprechenden Prompts.

a hyper-realistic photo of a young woman, 25 years old, with blue hair, bobcut with bangs and blue eyes, showing both of her hands to the camera man

maria, [german], beautiful women, 25 years old, blond long hair, soft-arched eyebrows, blue eyes, heart-shaped big lips, blue jeans, black tanktop

beautiful women, blond, long hair, blue eyes, white shirt with the text „FLUX“

Stylized portrait of a fierce woman in GTA IV art style, sharp contrasts and vibrant colors, urban nighttime background with neon lights, character wearing leather jacket and holding a pistol, determined expression, comic book-like shading, „GTA IV“ text prominently displayed in iconic GTA font, cinematic composition, high detail, 8K resolution

Close-up of a charismatic male tech influencer, mid 30s, glasses, neatly trimmed beard, casual business attire, standing in a modern office, depth of field effect

hyperrealistic, cheese cake with candles and the text „18“

Travel influencer overlooking a scenic mountain vista, backpack on, casual hiking outfit, golden sunset, captured with wide-angle lens, cinematic color grading

maria, [german], beautiful women, 25 years old, blond long hair, soft-arched eyebrows, blue eyes, heart-shaped big lips, blue jeans, black tanktop, outdoor, city, crowded area, paris, posing for instagram

Create a stylized logo design featuring the text ‚HELPED BY A NERD‘ in a bold, modern font.