4K4D: Echtzeit-4D-View-Synthese in 4K-Auflösung

(zju3dv.github.io)

9 Punkte von GN⁺ 2023-10-19 | 4 Kommentare | Auf WhatsApp teilen

Ein Paper zur „Echtzeit-4D-View-Synthese“, das das Problem langsamer Rendering-Geschwindigkeiten bei der Erzeugung hochauflösender Ansichten aus dynamisch wechselnden Perspektiven löst
4K4D beschleunigt das Rendering mithilfe einer 4D-Point-Cloud-Repräsentation, die Hardware-Rasterisierung unterstützt
Die 4D-Point-Cloud-Repräsentation basiert auf einem 4D-Feature-Grid, das Punkte normalisiert und leistungsfähige Optimierung ermöglicht
Ein neues hybrides Appearance-Modell wurde entwickelt, um die Rendering-Qualität zu verbessern und zugleich die Effizienz beizubehalten
Das Team entwickelte außerdem den Algorithmus Differentiable Depth Peeling, um das vorgeschlagene Modell effektiv aus RGB-Videos zu trainieren
Experimente zeigen, dass die 4K4D-Repräsentation mit einer RTX 4090 GPU auf dem DNA-Rendering-Datensatz mit 1080p-Auflösung mit über 400 FPS und auf dem ENeRF-Outdoor-Datensatz in 4K-Auflösung mit 80 FPS gerendert werden kann
30-mal schneller als frühere Methoden und mit Rendering-Qualität auf dem Stand der Technik
Die 4K4D-Methode wird über den Algorithmus Differentiable Depth Peeling aus Multi-View-RGB-Videos trainiert
Das Paper enthält qualitative Ergebnisse aus verschiedenen Datensätzen und einer Echtzeit-Demo
Die Autoren des Papers stammen von der Zhejiang University, Image Derivative Inc. und der Ant Group

4 Kommentare

ragingwind 2023-10-19

„Nutzer vermuten, dass diese Technologie in der Erwachsenenunterhaltung für stärker personalisierte Interaktionen eingesetzt werden könnte.“

xguru 2023-10-19

Ah, ja, natürlich ist es diese Seite, die den technologischen Fortschritt anführt..

xguru 2023-10-19

Wow ... wenn man das auf so etwas wie Videos anwendet, wäre das wohl ziemlich sehenswert in einem VR-Headset oder Ähnlichem.

GN⁺ 2023-10-19

Hacker-News-Kommentare

„4K4D: Echtzeit-4D-View-Synthese“ zieht aufgrund ihrer potenziellen Einsatzmöglichkeiten in verschiedenen Bereichen Aufmerksamkeit auf sich.
Nutzer vermuten, dass diese Technologie in der Erwachsenenunterhaltung für stärker personalisierte Interaktionen eingesetzt werden könnte.
Die Technologie könnte zur Rekonstruktion von Tatorten oder zur Analyse von Unfällen mithilfe von CCTV-Aufnahmen genutzt werden.
Sie könnte die Art und Weise, wie man Ereignisse wie Hochzeiten oder Filme ansieht, grundlegend verändern, indem Zuschauer ihren Blickwinkel selbst wählen können.
Es gibt Erwartungen an einen Einsatz bei Sportveranstaltungen, bei dem Zuschauer die Kamera auf dem Spielfeld oder Court frei bewegen können.
Die Technologie könnte verwendet werden, um künstliche Szenen zu erzeugen, bei denen sich Orte oder Schauspieler programmatisch verändern lassen.
Es wurden Fragen dazu gestellt, ob das Verfahren linear mit der Cache-Größe und der Videolänge skaliert und wie lange die Erstellung des Caches dauert.
Einige Nutzer hatten Probleme mit einer Website, die kurze Videos rendert, was auf mögliche Herausforderungen für VR hindeutet.
Es wurde gefragt, wie viele Kameras für diese Methode benötigt werden; das Paper deutet darauf hin, dass sie aus Mehrperspektiven-Quelldaten erzeugt wird.
Ein verwandtes Projekt mit Kinect v2 wurde erwähnt; es wurde eingestellt, scheint aber seine damaligen Grenzen überwinden zu können.
Die Technologie wurde mit Vorhersagen aus der Serie „Red Dwarf“ verglichen.
Sie wirkt wie eine revolutionäre Möglichkeit für AR/VR.
Nutzer spekulieren darüber, volumetrischen Sound und VR zu integrieren, um den „Braindance“ aus dem Spiel Cyberpunk 2077 nachzubilden, auch wenn die Integration körperlicher Empfindungen noch ein fernes Zukunftsziel zu sein scheint.

4K4D: Echtzeit-4D-View-Synthese in 4K-Auflösung

Verwandte Beiträge

4 Kommentare

Hacker-News-Kommentare