1 Punkte von GN⁺ 2024-02-25 | 1 Kommentare | Auf WhatsApp teilen

Fehlgeschlagene Oodle-Dekomprimierung durch Instabilität von Intel-Prozessoren

  • RAD ist sich eines Problems bewusst, das bei mit der Unreal Engine erstellten Spielen zu fehlgeschlagener Oodle-Data-Dekomprimierung oder Abstürzen führen kann.
  • Das Problem betrifft in erster Linie Intel-Prozessoren 13900K und 14900K; 13700, 14700 und verwandte Prozessoren sind in geringerem Maße betroffen.
  • Nur ein kleiner Teil dieser Prozessoren zeigt dieses Verhalten.
  • Das Problem entsteht durch eine Kombination aus BIOS-Einstellungen sowie den hohen Taktraten und dem hohen Stromverbrauch dieser Prozessoren, was unter hoher Last zu Systeminstabilität und unvorhersehbarem Verhalten führt.

Kein Software-Bug, sondern ein Hardwareproblem

  • Es scheint kein Software-Bug in Oodle oder Unreal zu sein, der dieses Problem verursacht.
  • Die BIOS-Einstellungen sind zu optimistisch, sodass einige Prozessoren unter hoher Last außerhalb ihres Funktionsbereichs arbeiten und dabei Taktraten und Leistungsaufnahme zu fehlerhaft ausgeführten Instruktionen führen.
  • Da die Oodle-Data-Dekomprimierung zusätzlich die Datenintegrität prüfen muss, entdeckt sie Inkonsistenzen sehr schnell – anders als anderer Gameplay-, Simulations-, Audio- oder Rendering-Code.

Häufige Fehlertypen beim Start von Spielen auf Basis der Unreal Engine

  • Der häufigste Fehlertyp ist die Fehlermeldung „DecompressShader(): Could not decompress shader (GetShaderCompressionFormat=Oodle)“.
  • Das Problem betrifft nicht nur Oodle; Systeme mit dieser Instabilität zeigen auch bei Standard-Benchmarks und Stress-Tests Fehler.
  • Programme, die den Prozessor mit vielen Threads stark auslasten, können Abstürze oder unvorhersehbares Verhalten verursachen.

Workarounds zur Problemlösung

  • Es gibt keinen Zugriff auf Prozessorinformationen, mit denen sich die genaue Ursache und die beste Lösung diagnostizieren ließen.
  • Viele Mainboard-/BIOS-Hersteller liefern Systeme mit Einstellungen aus, die Prozessoren außerhalb ihres sicheren Betriebsbereichs treiben.
  • Da nur eine kleine Zahl von Prozessoren betroffen ist, konnten einige Nutzer den Prozessor an den Hersteller zurücksenden und erfolgreich einen fehlerfreien Ersatz erhalten.
  • Andere Workarounds erfordern die Nutzung von Tuning-Utilities oder Änderungen an BIOS-Einstellungen.
  • Die Verwendung von Intel XTU, um den Multiplikator der Performance-Kerne von x55 auf x54 oder x53 zu senken, wird von vielen als erfolgreiche Lösung gemeldet.

Empfohlene Änderungen an BIOS-Einstellungen

  • Falls Overclocking aktiviert ist, sollte es deaktiviert werden; außerdem sollte „AI“- oder automatisches Overclocking vermieden werden.
  • Auf ark.intel.com sollten die korrekten Grenzwerte für den Prozessor nachgesehen und Leistungsgrenzen sowie Spannungen auf die von Intel empfohlenen sicheren Bereiche gesetzt werden.
  • BIOS-Einstellungen für „Enhanced Turbo“ oder „Enhanced Multithreading“ wie „ASUS MultiCore Enhancement“ oder „ASUS Performance Enhancement 3.0“ sollten deaktiviert werden.

Zusätzliche Schritte zur Fehlerbehebung für Mainboards von Intel, ASUS, Gigabyte und MSI

  • Intel XTU installieren und den AVX2-Test ausführen.
  • Wenn der AVX2-Test fehlschlägt, bestimmte BIOS-Einstellungsänderungen für Mainboards von ASUS, Gigabyte und MSI ausprobieren.

Kein direkter Endanwender-Support möglich

  • Für Endanwender von Spielen, die von diesem Problem betroffen sind, kann kein direkter Support geleistet werden; empfohlen wird die Nutzung der offiziellen Support-Kanäle des Spiele-Publishers sowie der Prozessor- und Mainboard-Hersteller.

Meinung von GN⁺

  • Dieses Problem ist für Nutzer bestimmter Intel-Prozessoren wichtig, und zur Systemstabilität kann eine Anpassung der BIOS-Einstellungen nötig sein.
  • Änderungen an BIOS-Einstellungen können riskant sein; Nutzer sollten daher vorsichtig vorgehen und nach Möglichkeit offiziellen Support in Anspruch nehmen.
  • Der Artikel liefert konkrete Maßnahmen zur Behebung von Softwarefehlern, die durch ein Hardwareproblem verursacht werden, und bietet damit nützliche Informationen für Nutzer mit technischen Problemen.

1 Kommentare

 
GN⁺ 2024-02-25
Hacker-News-Kommentare
  • Es wird der Problemlösungsprozess im Zusammenhang mit Erfahrungen mit einem AMD Threadripper 3970X geschildert. Gemeinsam mit AMD wurde das Problem über mehrere Monate untersucht, und es wurde eine Entschädigung von AMD erhalten. Letztlich wird das System mit einem von AMD bereitgestellten angepassten BIOS-Image betrieben. Die Verantwortung scheint bei Gigabyte zu liegen.
  • Eine Intel 13900k CPU war fehlerhaft, und bei Verwendung der Standardeinstellungen traten Probleme auf. Das System stürzte häufig ab, und es wurde viel Zeit aufgewendet, um das Problem zu lösen. Die CPU wurde ersetzt und bei Intel eine RMA (Retouren-/Reparaturservice) beantragt, jedoch versuchte Intel, die RMA mit Verweis auf Linux-Support zu vermeiden. Die RMA wurde über europäische Verbraucherschutzstellen durchgesetzt, anschließend wurde ein neues System gekauft und das alte verkauft. Künftig sollen keine Intel-Produkte mehr gekauft werden.
  • Es wird sarkastisch angemerkt, dass zur Minderung von Sicherheitsproblemen Hyper-Threading, Turbo-Modus, C-States, Effizienzkerne und Ähnliches deaktiviert werden müssten, was einer Rückkehr zum Funktionsumfang von vor 20 Jahren gleiche.
  • Es wurde ein neues System mit einer i9 149kf CPU und einem Asus Formula Mainboard aufgebaut, doch der Weg zu einem stabilen Betrieb war schwierig. Mit den Standardeinstellungen traten Probleme wie Spielabstürze sowie fehlgeschlagene Kernel- und emacs-Kompilierungen auf. Das System wurde stabilisiert, indem Turbo auf 5,4 GHz begrenzt und Einstellungen zur Begrenzung von maximaler Wattzahl und Temperatur aktiviert wurden. Das System ist nun stabil, aber es wird bedauert, dass die beworbene Leistung nicht vollständig genutzt werden kann.
  • Es wird auf Inhalte verwiesen, die an einen klassischen Beitrag von Raymond Chen erinnern.
  • Es werden Erinnerungen an die Probleme der früheren Pentium-III-1,13-GHz-CPU wachgerufen.
  • Der Zstd-Dekompressor ist oft die erste Komponente, die mit über das Netzwerk übertragenen Daten interagiert, und daher sehr empfindlich gegenüber Bitflips. Selbst wenn die Fehlerprüfung aktiviert ist, erkennt er Hardwareprobleme häufiger als andere Prozesse. Zstd enthält nur eine Prüfsumme der Originaldaten, was zwar die Datenintegrität sicherstellt, aber die Beurteilung erschwert, ob die komprimierten Daten beschädigt sind.
  • Es scheint sich um eine Seite zu handeln, die erstellt wurde, um auf ungewollte Beschwerden von Nutzern zu reagieren, die versuchten, "oodle"-Fehlerprotokolle nachzuverfolgen. Das erinnert an den Fall von SQLite im Jahr 2006.
  • Es wird eine Erfahrung mit dem Kauf eines ASUS-TUF-Mainboards geteilt. Gewünscht waren grundlegende Funktionen, doch die BIOS-Einstellungen förderten übermäßiges Overclocking, sodass mehrere Einstellungen, einschließlich der RAM-Timings, manuell angepasst werden mussten.
  • Es wird Überraschung darüber ausgedrückt, dass Epic Games RAD übernommen hat.