- Vergleich von drei Modellen mit demselben Prompt hinsichtlich thematischer Genauigkeit, Stiltreue, Kohärenz und Ethik
Fotografie: Menschen
- Derzeit liegt Midjourney im Bereich der Fotografie vorn, aber Firefly 2 folgt mit knappem Abstand
- Wenn man weniger stilisierte und natürlichere Headshots möchte, sollte man künftig Firefly 2 in Betracht ziehen
- Für fotografische Zwecke sollte man DALL-E 3 besser nicht verwenden
Fotografie: Stilistische Menschen
- In letzter Zeit werden viele stilistische Menschenbilder erstellt
- Diese Prompts wurden speziell für Midjourney angepasst, daher könnte eine gewisse Voreingenommenheit bestehen
- Einige zentrale Punkte sind jedoch:
- Midjourney funktioniert am besten mit komplexeren Prompts und zeigt eine starke Kohärenz
- Midjourney ist hervorragend darin, komplexe Kombinationen aus Medium, Komposition und Beleuchtung zu erzeugen
- DALL-E scheint Schwierigkeiten zu haben, Beleuchtung für People of Color einzubinden, was die Genauigkeit der Ergebnisse verringert
- Firefly erzeugt die vielfältigsten Ergebnisse, wenn Diversität nicht ausdrücklich gefordert wird
- Wenn kreativere Fotografie ersetzt werden soll, könnten sowohl Firefly als auch DALL-E 3 Schwierigkeiten haben, das gewünschte Qualitäts- und Kohärenzniveau zu erreichen
Fotografie: Objekte
- Ich denke, dass Midjourney insgesamt die realistischste Objektkohärenz erreicht
- Firefly und DALL-E holen auf, aber die Stilpräferenzen dieser Modelle werden die Ergebnisse zweifellos beeinflussen
Illustration
- Bei Illustrationen haben alle erhebliche Fortschritte gemacht, aber für nuancierte Ergebnisse bleibt Midjourney weiterhin die beste Wahl
- Trotzdem lohnt es sich, mit mehreren Modellen zu experimentieren und sie an den eigenen Stil anzupassen
Typografie
- Erst seit Kurzem ist es möglich, korrekte Wörter zu erzeugen
- In allen durchgeführten Tests war DALL-E 3 das einzige Modell, das Wörter als vollständige Einheiten zuverlässig gerendert hat
- Das Wort in diesem speziellen Fall war "Design", und die Konsistenz blieb in allen Experimenten durchgängig erhalten
Fazit
- Die Landschaft verändert sich eindeutig, aber die Kernpunkte, die ich betonen möchte, sind:
- Adobe schließt im Fotobereich die Lücke eindeutig und entwickelt sich zu einem starken Wettbewerber
- DALL-E 3 ist der einzige Generator, der Typografie einigermaßen gut erzeugen kann (abgesehen von Ideogram)
- DALL-E 3 ist hervorragend bei der Erstellung von Illustrationen und hat in Kombination mit seiner Worterzeugung das Potenzial, im Hinblick auf Skalierung und generalisierte Stile zu einem „Bildgenerator für Clipart“ zu werden
- Für Basisbilder oder das Generieren von Bildern neben anderen Tätigkeiten (über ChatGPT) ist es geeignet, scheint aber vorerst kein hochentwickeltes Design-Tool zu werden
- Midjourney erzeugt weiterhin die realistischsten und kohärentesten Fotos.
- Bei der kreativen Kontrolle ist Midjourney unerreicht
2 Kommentare
Warum wurde Stable Diffusion weggelassen?
Liegt das an Midjourney?
Als ich DALL-E 3 ausprobiert habe, fand ich es unglaublich faszinierend, wie klar es Text darstellen kann.
Aber bei der Qualität scheint Midjourney wohl immer noch am besten zu sein.