- Ziel ist es, ein Bildsynthese-Modell zu entwickeln, das jeder verstehen kann
- Der Sampling-Code ist nur 12 Zeilen lang, sodass ihn jeder in wenigen Minuten verstehen kann
- Um die benötigte Rechenleistung zu reduzieren, arbeitet es wie StableDiffusion in einem quantisierten latenten Raum
1 Kommentare
Es ist jedes Mal erstaunlich, wenn man eine KI sieht, die mit so wenig Code läuft.