19 Punkte von xguru 2023-10-30 | 2 Kommentare | Auf WhatsApp teilen
  • Vergleich von drei Modellen mit demselben Prompt hinsichtlich thematischer Genauigkeit, Stiltreue, Kohärenz und Ethik

Fotografie: Menschen

  • Derzeit liegt Midjourney im Bereich der Fotografie vorn, aber Firefly 2 folgt mit knappem Abstand
  • Wenn man weniger stilisierte und natürlichere Headshots möchte, sollte man künftig Firefly 2 in Betracht ziehen
  • Für fotografische Zwecke sollte man DALL-E 3 besser nicht verwenden

Fotografie: Stilistische Menschen

  • In letzter Zeit werden viele stilistische Menschenbilder erstellt
  • Diese Prompts wurden speziell für Midjourney angepasst, daher könnte eine gewisse Voreingenommenheit bestehen
  • Einige zentrale Punkte sind jedoch:
    • Midjourney funktioniert am besten mit komplexeren Prompts und zeigt eine starke Kohärenz
    • Midjourney ist hervorragend darin, komplexe Kombinationen aus Medium, Komposition und Beleuchtung zu erzeugen
    • DALL-E scheint Schwierigkeiten zu haben, Beleuchtung für People of Color einzubinden, was die Genauigkeit der Ergebnisse verringert
    • Firefly erzeugt die vielfältigsten Ergebnisse, wenn Diversität nicht ausdrücklich gefordert wird
    • Wenn kreativere Fotografie ersetzt werden soll, könnten sowohl Firefly als auch DALL-E 3 Schwierigkeiten haben, das gewünschte Qualitäts- und Kohärenzniveau zu erreichen

Fotografie: Objekte

  • Ich denke, dass Midjourney insgesamt die realistischste Objektkohärenz erreicht
  • Firefly und DALL-E holen auf, aber die Stilpräferenzen dieser Modelle werden die Ergebnisse zweifellos beeinflussen

Illustration

  • Bei Illustrationen haben alle erhebliche Fortschritte gemacht, aber für nuancierte Ergebnisse bleibt Midjourney weiterhin die beste Wahl
  • Trotzdem lohnt es sich, mit mehreren Modellen zu experimentieren und sie an den eigenen Stil anzupassen

Typografie

  • Erst seit Kurzem ist es möglich, korrekte Wörter zu erzeugen
  • In allen durchgeführten Tests war DALL-E 3 das einzige Modell, das Wörter als vollständige Einheiten zuverlässig gerendert hat
  • Das Wort in diesem speziellen Fall war "Design", und die Konsistenz blieb in allen Experimenten durchgängig erhalten

Fazit

  • Die Landschaft verändert sich eindeutig, aber die Kernpunkte, die ich betonen möchte, sind:
  • Adobe schließt im Fotobereich die Lücke eindeutig und entwickelt sich zu einem starken Wettbewerber
  • DALL-E 3 ist der einzige Generator, der Typografie einigermaßen gut erzeugen kann (abgesehen von Ideogram)
    • DALL-E 3 ist hervorragend bei der Erstellung von Illustrationen und hat in Kombination mit seiner Worterzeugung das Potenzial, im Hinblick auf Skalierung und generalisierte Stile zu einem „Bildgenerator für Clipart“ zu werden
    • Für Basisbilder oder das Generieren von Bildern neben anderen Tätigkeiten (über ChatGPT) ist es geeignet, scheint aber vorerst kein hochentwickeltes Design-Tool zu werden
  • Midjourney erzeugt weiterhin die realistischsten und kohärentesten Fotos.
    • Bei der kreativen Kontrolle ist Midjourney unerreicht

2 Kommentare

 
hhkkkk 2023-10-30

Warum wurde Stable Diffusion weggelassen?
Liegt das an Midjourney?

 
kuroneko 2023-10-30

Als ich DALL-E 3 ausprobiert habe, fand ich es unglaublich faszinierend, wie klar es Text darstellen kann.
Aber bei der Qualität scheint Midjourney wohl immer noch am besten zu sein.