- Stable Diffusion 3 ist das leistungsstärkste Text-Bild-Modell und bietet deutlich verbesserte Leistung bei Multi-Subject-Prompts, Bildqualität und Schreibtreue
- Es ist noch nicht breit verfügbar, aber die Registrierung für die Warteliste zum Early Preview hat begonnen
- Wie bei früheren Modellen ist diese Vorschauphase wichtig, um Erkenntnisse zu gewinnen, mit denen Leistung und Sicherheit verbessert werden
Modellumfang und Technologie
- Die Stable Diffusion 3 Modell-Suite deckt einen Bereich von 800M bis 8B Parametern ab
- Dieser Ansatz steht im Einklang mit unseren Kernwerten und dem Ziel, für alle zugänglich zu sein, und bietet verschiedene Optionen für Skalierbarkeit und Qualität, die den kreativen Anforderungen der Nutzer am besten entsprechen
- SD3 kombiniert die Diffusion Transformer-Architektur mit Flow Matching
- Ein detaillierter technischer Bericht wird in Kürze veröffentlicht
Sichere und verantwortungsvolle KI-Praxis
- Sichere und verantwortungsvolle KI-Praxis ist für uns zentral
- Um den Missbrauch von Stable Diffusion 3 zu verhindern, ergreifen wir sinnvolle Maßnahmen, die vom frühen Modelltraining über Tests und Bewertung bis zur Bereitstellung fortgeführt werden
- Für die Initialvorschau wurden zahlreiche Sicherheitsvorkehrungen eingeführt
- Durch die fortlaufende Zusammenarbeit mit Forschenden, Experten und der Community erwarten wir, den Innovationsgrad weiter zu steigern, je näher wir der Veröffentlichung des Modells kommen
Verpflichtung und Förderung von Kreativität
- Unsere Verpflichtung zu einer offenen, sicheren und allgemein zugänglichen Generative AI ist fest
- Mit Stable Diffusion 3 werden wir eine anpassungsfähige Lösung anbieten, die Privatpersonen, Entwicklern und Unternehmen dabei unterstützt, ihre Kreativität zu entfalten
- Wenn Sie andere Bildmodelle kommerziell nutzen möchten, bevor Stable Diffusion 3 veröffentlicht wird, können Sie die Membership-Seite von Stability AI besuchen oder über die Entwicklerplattform auf die API zugreifen
1 Kommentare
Hacker News Kommentar
Es verwendet einen neuen Typ von Diffusions-Transformer und kombiniert ihn mit Flow-Matching und weiteren Verbesserungen.
Der Fokus auf Sicherheit scheint mir angesichts des jüngsten Gemini-Vorfalls eine verpasste Marketingchance zu sein.
Angesichts der aktuellen Zensursituation wird es interessant zu sehen sein, was diesmal mit „Sicherheit“ gemeint ist.
Die Hälfte der Ankündigung lautet: „Wir sind wirklich verantwortungsbewusst und sicher.“
Die Demo-Bilder sind alle „Artwork“.
Die Text-/Schreibebereich ist hier stark verbessert.
Der „Sicherheits“-Teil wurde neu formuliert, ersetzt aber ein KI-Tool durch ein imaginäres Messer namens „Big Knife“.