DeepFloyd IF - Open-Source-Text-zu-Bild-Modell
(github.com/deep-floyd)- Neues Bildmodell von Stability AI
- Höheres Sprachverständnis als bisherige Modelle und Erzeugung fotorealistischer Bilder
- Kombination aus einem auf T5 Transformer basierenden eingefrorenen Text-Encoder und einem dreistufigen Pixel-Diffusionsmodul
- 64x64, 256x256, 1024x1024px
- Zero-shot-FID-Score von 6.66 (COCO-Datensatz)
Noch keine Kommentare.