Stable Diffusion ist das bislang wichtigste KI-Kunstmodell
(thealgorithmicbridge.substack.com)- Ähnliche Qualität wie DALL·E 2 oder MidJourney, aber Open Source
- Läuft bereits in Google Colabs, und es wurden Figma-Plugins dafür erstellt
- MidJourney hat sogar versucht, es mit Stable Diffusion zu kombinieren
- Die Qualität ist deutlich besser als bei früheren Open-Source-Projekten wie DALL·E Mini oder Disco Diffusion
- Über Dreamstudio lassen sich ganz einfach Bilder erzeugen: bis zu 200 kostenlos, danach £0.01 pro Bild (DALL·E: $0.03)
- Bald soll auch eine Funktion hinzukommen, mit der sich durch Hinzufügen eines Prompts zu einem anderen Bild ein neues Bild erzeugen lässt
- Dank des Vorteils als Open Source wird es bereits an vielen Stellen eingesetzt
- Outpainting + Inpainting-Collagen
- Magazincover-Design, Comics zeichnen, Animationen erstellen
- Img2Img
- Emad Mostaque von Stability.AI, das Stable Diffusion entwickelt, sagte dazu
Mit der Veröffentlichung schnellerer, besserer und spezifischerer Modelle wird die Qualität stetig steigen
Nicht nur bei Bildern: Nächsten Monat sollen Audio folgen, danach 3D und Video
Außerdem werden mehr Modelle für Sprache, Code und weitere Bereiche trainiert
2 Kommentare
Das Demo-Modell ist schnell. Wenn es in der Praxis tatsächlich ungefähr dieses Tempo erreicht, dürfte der Einsatzbereich enorm sein.
Ich habe es auch auf Koreanisch getestet, dabei waren menschliche Gesichter verzerrt, was ein wenig unheimlich war.
Stable Diffusion – ein dem DALL-E ähnliches Open-Source-Text-to-Image-Modell
Lexica – Suche in mehr als 5 Millionen von Stable Diffusion erzeugten Bildern