9 Punkte von xguru 2023-07-28 | 2 Kommentare | Auf WhatsApp teilen
  • Das bislang fortschrittlichste Text-to-Image-Modell
    • Lebendigere Bilder, präzisere Farben sowie bessere Kontraste, Schatten und Beleuchtung im Vergleich zur vorherigen Version
    • 3,5 Milliarden Parameter
  • Kann in wenigen Sekunden Bilder mit einer Auflösung von 1 Megapixel erzeugen
  • Anpassbar und für Konzepte sowie Stile feinabstimmbar
  • Auch die Textgenerierung wurde verbessert, einschließlich fortgeschrittener Texterzeugung und besserer Lesbarkeit
  • Unterstützt Inpainting, Outpainting und Image-to-Image-Prompts

2 Kommentare

 
ninebow 2023-07-28

Ich habe eine automatische ausführliche Erläuterung des offiziellen Ankündigungsbeitrags mit GPT-4 erstellt.


Ankündigung von SDXL 1.0 (ANNOUNCING SDXL 1.0)

Einführung

Das Team von Stability AI ist stolz darauf, SDXL 1.0 als offenes Modell zu veröffentlichen – den nächsten Schritt in der Evolution von Text-zu-Bild-Generierungsmodellen. Nach der eingeschränkten, ausschließlich forschungsbezogenen Veröffentlichung von SDXL 0.9 wurde die vollständige Version von SDXL zum weltweit besten offenen Modell für die Bildgenerierung weiterentwickelt.

Zusammenfassung

  • SDXL 1.0 ist das wichtigste Bildmodell von Stability AI und das beste offene Modell für die Bildgenerierung. Wir haben es mit vielen anderen Modellen verglichen und sind zu dem Ergebnis gekommen, dass Menschen die von SDXL 1.0 erzeugten Bilder gegenüber denen anderer offener Modelle bevorzugen. Diese Forschungsergebnisse basieren auf mehreren Wochen an Präferenzdaten, die aus den Generationen experimenteller Modelle auf unserem Discord gesammelt wurden, sowie auf externen Tests.

  • SDXL erzeugt hochwertige Bilder in praktisch allen Kunststilen und ist das beste offene Modell für Fotorealismus. Einzigartige Bilder können gepromptet werden, ohne dass das Modell einen bestimmten eigenen „Look“ aufzwingt, was vollständige stilistische Freiheit ermöglicht. SDXL 1.0 ist besonders gut auf klare und präzise Farben abgestimmt und bietet im Vergleich zu seinem Vorgänger besseren Kontrast, bessere Beleuchtung und bessere Schatten. Außerdem kann SDXL Konzepte erzeugen, mit denen Bildmodelle beim Rendern oft Schwierigkeiten haben, etwa Hände und Text oder räumlich angeordnete Kompositionen (z. B. eine Frau, die im Hintergrund von einem Hund verfolgt wird).

  • SDXL benötigt nur wenige Wörter, um komplexe, detailreiche und ästhetisch überzeugende Bilder zu erzeugen. Nutzer müssen keine qualifizierenden Begriffe wie „Meisterwerk“ mehr verwenden, um hochwertige Bilder zu erhalten. Außerdem kann SDXL den Unterschied zwischen Konzepten wie „The Red Square“ (der berühmte Ort) und „red square“ (die Form) verstehen.

  • SDXL 1.0 hat unter den Open-Access-Bildmodellen die höchste Parameterzahl und basiert auf einer innovativen neuen Architektur aus einem Basismodell mit 3.5B Parametern und einem Refiner mit 6.6B Parametern. Das Gesamtmodell besteht aus einer Mixture-of-Experts-Pipeline für latente Diffusion: In der ersten Stufe erzeugt das Basismodell (verrauschte) Latents, die anschließend von einem Verfeinerungsmodell weiterverarbeitet werden, das auf die abschließenden Denoising-Schritte spezialisiert ist. Das Basismodell kann dabei auch als eigenständiges Modul verwendet werden. Diese zweistufige Architektur bietet einen robusten Ansatz für die Bildgenerierung und liefert nochmals verbesserte Ergebnisse.

Referenzen

Stability AI Blog: Der Blog von Stability AI bietet detaillierte Informationen zu den neuesten Forschungsarbeiten und Ankündigungen des Unternehmens. Dort finden sich zusätzliche Informationen zu aktuellen Modellen wie SDXL 1.0.
https://stability.ai/blog

Stable Diffusion: Diese Website bietet detaillierte Informationen zur Stable-Diffusion-Technologie von Stability AI. Diese Technologie ist eine Kernkomponente von SDXL 1.0, und über die Website lässt sich ein tieferes Verständnis dieser Technologie gewinnen.
https://stability.ai/stable-diffusion

Discord Community: In dieser Discord-Community kommen die Forschenden und Nutzer von Stability AI zusammen, um ihre Arbeiten zu teilen und zu diskutieren. Über diese Community kann man die Erfahrungen anderer hören, die Modelle wie SDXL 1.0 nutzen.
https://discord.gg/stablediffusion

 
ninebow 2023-07-28

Im offiziellen Ankündigungsbeitrag von StabilityAI gibt es noch etwas ausführlichere Informationen, daher lasse ich den Link hier. :)

https://stability.ai/blog/stable-diffusion-sdxl-1-announcement