- Ein Framework zur Steuerung des Kamerablickwinkels aus einem einzelnen RGB-Bild mithilfe großskaliger Diffusionsmodelle
- Obwohl das Modell mit einem synthetischen Datensatz trainiert wurde, funktioniert es ohne Vortraining auch bei realen Bildern oder impressionistischen Gemälden gut im Zero-shot-Modus
- Mit diesem blickwinkelsteuernden Diffusionsansatz ist es auch möglich, 3D aus einem einzigen Bild zu rekonstruieren
- Qualitative und quantitative Experimente zeigen, dass es dank internetgroßem Vortraining eine deutlich bessere Leistung als andere Modelle bietet
1 Kommentare
Bis letztes Jahr dachte ich noch, dass es bis dahin noch ein weiter Weg ist,
aber in letzter Zeit tauchen gefühlt jeden zweiten Tag neue Technologien und Ergebnisse auf..