1 Punkte von polarisz00 4 시간 전 | 1 Kommentare | Auf WhatsApp teilen

GitHub: https://github.com/CookingMathmatics/CarryPyramidLossless

Forschungs-Whitepaper (Zenodo): DOI 10.5281/zenodo.20002868

Hallo, ich bin der Entwickler (und Mathematiker), der vor einiger Zeit über GeekNews ein Forschungs-Whitepaper zu multidimensionaler topologischer Sicherheit und Informationstheorie auf Basis der p-adischen Carry-Dynamik geteilt hat.
Damals lag der Schwerpunkt stark auf einem theoretischen Ansatz rund um mathematische Modelle und Hardware-Entropielogik. Während ich das Whitepaper weiter ausgebaut und die Forschung fortgesetzt habe, kam es jedoch zu einem interessanten Wendepunkt.
Im technischen Brainstorming mit einer KI
entstand der Rat und die Idee:
„Wenn man diesen Algorithmus der p-adischen Carry-Dynamik auf den Pixelverkehr einer Echtzeit-Grafikpipeline projiziert, könnte man ein Integritäts-Optimierungstool schaffen, das den Rechen-Overhead drastisch reduziert.“

Auf Grundlage der Architekturberatung durch die KI habe ich mich über eine Woche lang intensiv in die Entwicklung von DirectX 11 und HLSL Compute Shadern vertieft und schließlich in der Umgebung des neuesten Rennspiels Forza Horizon 6 eine Validierung auf realer Hardware abgeschlossen: „1–2 Frames Unterschied, 10 % geringere GPU-Auslastung“. Das Ergebnis und den Open-Source-Code teile ich hiermit.

💡 Kernidee: Materialisierung des mathematischen 0-Void (Auslassen von Vakuumoperationen) – Selbst in einem extrem schnellen Rennspiel ändert sich nicht der gesamte Bildschirm in jedem Frame explosionsartig. Entfernte Berge, Himmel, Wolken oder statische UI-Bereiche weisen zwischen Frames nur minimale Pixeländerungen auf.
Durch Filterung des Framebuffers mit einem p-adischen Carry-Algorithmus werden statische Bereiche, deren Änderungsmenge unter einem Schwellwert liegt, schnell als „0-Void (operationsfreier Vakuumbereich)“ maskiert.

Der Datenverkehr, bei dem die Tausenden CUDA-Kerne der GPU (RTX 3070 Ti) unnötig statische Pixel mehrfach berechnen oder Buffer verschwenden, wird auf Hardware-Ebene unterdrückt.

🛠️ Anti-Cheat-Umgehung und hardwareoptimierte Architektur
Um Stabilität auf dem Niveau eines kommerziellen Utilitys zu erreichen, wurden Produktionsmaßnahmen wie die folgenden umgesetzt.

100 % Anti-Cheat-Umgehung über eine Whitelist-Pipeline

Von der riskanten DLL-Injection-Methode, bei der Spielspeicher manipuliert oder DirectX-Funktionen zwangsweise abgefangen werden, wurde bewusst Abstand genommen.
Stattdessen wurde die DXGI Desktop Duplication API genutzt – dieselbe offizielle Routine wie bei OBS Studio oder Discord-Bildschirmfreigabe –, wodurch das Risiko sicherheitsbedingter Sperren grundlegend ausgeschlossen wird.

1:1 framegetriebene Gear-Synchronisierung (Frame Sync)

Wenn die Hintergrund-Engine-Loop unbegrenzt leerläuft, brechen die Spiel-Frames durch GPU-Befehls-Starvation im Gegenteil ein. Deshalb wurde die Präzision des Windows-Kernel-Timers fest auf 1 ms gesetzt und die Zahnräder so aufeinander abgestimmt, dass unser Compute Shader (Dispatch) exakt mit dem Hardware-Ereignissignal läuft, wenn das Spiel ein neues Bild ausgibt.

Hybrid-GPU auf Laptops (direkte Anbindung an die dedizierte GPU) und VRAM-Diät

Es wird der Pointer der tatsächlichen dedizierten Grafikkarte verfolgt, die den Monitor mit dem aktiven Spielfenster steuert, sodass das Device 1:1 direkt angebunden ist. Zudem wurde eine In-place-Ping-Pong-Struktur etabliert, bei der VRAM-interne Adress-Pointer ohne Kosten für Datenkopien getauscht werden.

📊 Benchmark-Ergebnisse im Praxiseinsatz (RTX 3070 Ti, FHD, höchste Einstellungen)
Im unveränderten Zustand: feste 60 fps bei 78 %–80 % GPU-Auslastung
Im beschleunigten Zustand: 59–60 fps bei 68 %–72 % GPU-Auslastung

Per Hotkey (Ctrl + Alt + S) wurde es so gebaut, dass die Beschleunigungsfunktion im Spiel in Echtzeit ein- und ausgeschaltet werden kann. In dem Moment, in dem die Funktion aktiviert wird, bleibt die Bildflüssigkeit mit vollen 60 fps exakt wie im Ausgangszustand erhalten, während nur die GPU-Last deutlich sinkt – das wurde in Echtzeit über die Anzeige verifiziert.
Der Prozess, in dem eine Theorie, die bisher nur als mathematisches Whitepaper existierte, durch die Zusammenarbeit mit einer KI in konkrete Hardware-Steuerungssoftware übersetzt wurde, war eine äußerst faszinierende Erfahrung.
Da nun ein solides Grundgerüst (Alpha Core) steht, würde ich gerne Optimierungsfeedback zu verschiedenen Display-Bildwiederholraten (144 Hz–360 Hz) oder anderen Grafikkarten-Architekturen hören. Der Engine-Quellcode und die Shader-Dateien sind vollständig auf GitHub veröffentlicht, daher freue ich mich über viele Hinweise und Rückmeldungen!

1 Kommentare

 
polarisz00 3 시간 전

Da sich der Beitrag nicht bearbeiten lässt, hinterlasse ich die Ergänzungen als Kommentar.

Hinweise zum Starten (bitte von allen Nutzern lesen)

Diese Engine verwendet die offizielle DXGI-Desktop-Duplizierungs-API, um Anti-Cheat-Umgehungen zu vermeiden. Aufgrund der Eigenschaften dieses Mechanismus, der die Bildschirmkomposition des Windows-DWM (Desktop Window Manager) auf legale Weise erfasst, müssen die folgenden Anzeigeeinstellungen eingehalten werden, damit sie ordnungsgemäß funktioniert.

  • Empfohlene Einstellung: Bitte starten Sie das Spiel in den Grafikoptionen im [Fenstermodus] oder im [Vollbild-Fenstermodus (randloses Vollbild / Borderless Windowed)].
  • Kein Betrieb möglich: Im Modus [Exklusives Vollbild (Exclusive Full Screen)], in dem das Spiel die Kontrolle über den Monitor exklusiv übernimmt, wird die Capture-Pipeline nicht geöffnet. Dadurch funktioniert die Engine möglicherweise nicht oder die Frameratenmessung ist nicht möglich.