20 Punkte von GN⁺ 2025-12-24 | 1 Kommentare | Auf WhatsApp teilen
  • Es wurde bekannt, dass der für Valves Steam Deck entwickelte SCX-LAVD-Linux-Scheduler auch in Metas großskaliger Serverumgebung effektiv funktioniert
  • Dieser Scheduler wurde mit dem Ziel einer effizienten Ressourcenverwaltung auf dem Niveau einer Spielkonsole entwickelt; Meta verfolgt damit Leistungssteigerungen bei Server-Workloads und eine Minimierung der Latenz
  • Die für tragbare Spielgeräte entwickelte Architektur des Latency-criticality Aware Virtual Deadline-Schedulings zeigt auch auf Hyperscale-Servern Leistung und Stabilität
  • Im Vergleich zum bestehenden EEVDF-Scheduler zeigt er eine ähnliche oder bessere Leistung und kann sich an verschiedene Hardwarekonfigurationen anpassen
  • Meta prüft SCX-LAVD nicht als Speziallösung, sondern als Kandidaten für einen Standard-Server-Scheduler
  • Ein seltener Fall, in dem sich für Gaming-Hardware entwickelte Technik auf große Rechenzentren ausweitet

Hintergrund der Präsentation auf der Linux Plumbers Conference 2025

  • Auf der Linux Plumbers Conference 2025 in Tokio stellten Meta-Ingenieure die Inhalte vor
  • Der Vortrag trug den Titel „How do we make a Steam Deck scheduler work on large servers“ und erklärte den Weg, einen Scheduler für tragbare Geräte auf Server zu skalieren
  • Geteilt wurden Erfahrungen bei der Validierung und Anpassung des für das Steam Deck entwickelten Schedulers an Serverumgebungen

Überblick über den SCX-LAVD-Scheduler

  • SCX-LAVD wurde als Latency-criticality Aware Virtual Deadline Scheduler konzipiert
  • Er wurde für Valves Steam-Deck-Umgebung mit dem Ziel niedriger Latenz und stabiler Leistung entwickelt
  • Verwendet wird eine erweiterbare Scheduler-Architektur, die auf dem Linux-Framework sched_ext läuft
  • Meta erwartet dadurch geringere Latenzzeiten, konstantere Performance und eine bessere Servereffizienz
  • Da Valves Design auf Echtzeitverarbeitungsanforderungen im Gaming-Bereich zugeschnitten ist, bietet die Struktur auch auf Servern Vorteile beim Management dauerhafter Lasten

Ergebnisse des Einsatzes in Metas Serverumgebung

  • Ein stabiler Betrieb wurde auch bei verschiedenen CPU- und Speicherkonfigurationen von Meta-Servern bestätigt
  • Die Load-Balancing-Leistung über CCX- und LLC-Grenzen hinweg fiel sehr gut aus
  • In Umgebungen, in denen kein auf bestimmte Workloads optimierter Scheduler nötig ist, eignet er sich als Standardwahl

Bestehende Scheduler und andere Einsatzfälle

  • SCX-LAVD zeigt im Vergleich zum EEVDF-Scheduler eine ähnliche oder bessere Leistung
  • Er wird bereits in Linux-Gaming-Umgebungen wie CachyOS Handheld Edition und Bazzite eingesetzt
  • Die Entwicklung des Schedulers wurde von Igalia im Rahmen eines Vertrags mit Valve federführend vorangetrieben

Metas künftige Nutzungsrichtung

  • Meta bezeichnet SCX-LAVD als „Meta’s New Default Scheduler“
  • Er wird als Scheduler bewertet, der sich über große Server-Flotten hinweg universell einsetzen lässt
  • Weitere Forschungsergebnisse und Leistungsanalysen wurden über das LPC-Vortragsvideo und die Folien veröffentlicht

1 Kommentare

 
GN⁺ 2025-12-24
Hacker-News-Kommentare
  • Valve treibt die Weiterentwicklung des Linux-Ökosystems faktisch im Alleingang voran
    Proton/Wine hat sich stark weiterentwickelt, damit Windows-Spiele unter Linux laufen, und dank des Steam Deck gibt es inzwischen auch HDR- und VRR-Unterstützung für Wayland
    Der Scheduler, der zur Verbesserung des Frame-Pacings entwickelt wurde, wird jetzt sogar in den Rechenzentren von Meta eingesetzt
    Letztlich ist die Effizienz von Meta-Servern also besser geworden, weil Valve Igalia dafür bezahlt hat, die Ruckler in Elden Ring zu verringern. Das ist der echte positive Kreislauf von Open Source
    • Beim Versuch, die Ruckler in Spielen zu verringern, kam am Ende ein optimierender Shader-Compiler für den Open-Source-Grafik-Stack heraus
      Zugehörige Ankündigung: Steam Community Announcement
    • Spieleentwicklung ist nach wie vor ein unterschätztes Feld
      Unzählige Software- und Hardware-Optimierungen stammen aus der Spieleentwicklung
      Da die RAM-Preise zuletzt wieder steigen, wäre es wünschenswert, wenn der Fokus wieder stärker auf Optimierung läge, um unnötige Lasten in der gesamten Branche zu reduzieren
    • Es gab zwar mehrere Linux-Distributionen mit Desktop-Fokus, aber die meisten waren in einem Zustand von „technisch möglich, aber nur mit viel Unbequemlichkeit nutzbar“
      Bevor Valve selbst aktiv wurde, gab es niemanden, der diese Probleme wirklich anging
    • Mit der Zeit wird Valve wohl sogar Dinge anfassen, die Microsoft jahrelang aufgeschoben hat
      Ich halte es für deutlich besser, Dinge selbst zu ändern, statt nur zu warten
    • Dank Spielen war die GPU-Industrie bereits auf den AI-Boom vorbereitet
      Früher war Spieleentwicklung immer die vorderste Front der Software-Optimierung
  • Interessant ist, dass Valve Linux-bezogene Entwicklung mit einer auftragnehmerzentrierten Struktur über Firmen wie Igalia vorantreibt
    Ich habe gehört, dass Proton auf ähnliche Weise entstanden ist. Valve scheint stärker auf externe Auftragnehmer als auf internes Personal zu setzen
    • Igalia ist ein ungewöhnliches Unternehmen, das Open-Source-Entwicklungssponsoring für mehrere Firmen strukturiert organisiert
      Es arbeitet mit verschiedenen Unternehmen wie Google zusammen und wickelt komplexe Fragen rund um Bezahlung und Sozialleistungen effizient ab
    • Valve konzentriert sich intern nur auf Spiele, Hardware und Distribution und delegiert andere Bereiche an spezialisierte Auftragnehmer
      Ich denke, genau deshalb ist diese Struktur kosteneffizient und liefert hochwertige Ergebnisse
      Natürlich gibt es auch Kontroversen um Valve, aber man sollte die guten wie die schlechten Seiten anerkennen
    • Valve ist eine kleine, flache Organisation mit etwa 350 bis 400 Mitarbeitern
      Deshalb ist es viel einfacher, über Auftragnehmer zu skalieren als über Festanstellungen
    • Proton ist ein Projekt, das gemeinsam von internen Valve-Entwicklern, CodeWeavers und der Community geschaffen wurde
      Spezialgebiete wie DirectX→Vulkan- oder OpenGL→Vulkan-Übersetzung werden an Organisationen wie Igalia ausgelagert
    • Valve neigt dazu, die Zahl der Mitarbeiter möglichst klein zu halten
      Bei solchen festen und anspruchsvollen Projekten ist Outsourcing für praktisch jedes Unternehmen sinnvoll
  • sched_ext ist ein bei Meta entwickelter Scheduler
    Mehrere Unternehmen arbeiten zusammen und entwickeln ihn gemeinsam im gemeinsamen GitHub-Repository
  • Ich frage mich, wie gut Game-Streaming unter Linux funktioniert
    Der Support für Windows 10 endet, deshalb will ich nun komplett auf Linux umsteigen
  • Ich nutze seit vier Monaten Bazzite Desktop als Hauptsystem, und Windows wirkt inzwischen praktisch wie aufgegebene Software
    Selbst nach Updates bleibt es träge und schwer zu verwalten
    • Ist Bazzite nicht eher eine gamingzentrierte Distribution?
      Alle Aufgaben darauf zu erledigen wirkt etwas seltsam. Das fühlt sich an, als würde man auf einem Steam Deck Excel benutzen
  • Das Magische an Open Source ist, dass Valve nichts wie Enterprise-Lizenzen verlangt
    • Stimmt, aber Red Hat muss den Quellcode nicht offenlegen, solange es keine RHEL-Binärdateien verteilt
      Solange Meta das nur auf internen Servern einsetzt, kann es auch ein selbst gepatchtes Linux privat halten
    • Es ist erstaunlich, dass ein Scheduler für eine Handheld-Konsole auch auf Facebook-Servern gut funktioniert
    • Umgekehrt haben SteamOS und verschiedene Linux-Distributionen auch Metas Kyber-IO-Scheduler übernommen, um Mikroruckler zu beheben
      Es ist also eine Struktur wechselseitiger Beeinflussung
    • Wenn man darüber nachdenkt, könnten die 30 % Gebühr, die man beim Kauf von Spielen auf Steam zahlt, eine Art Lizenzkosten sein
  • Interessant ist, dass Meta Valves Scheduler auf Servern eingesetzt hat
    Ich frage mich, wie so ein Versuch überhaupt angefangen hat
    • Vermutlich hat irgendein Ingenieur es getestet, Leistungsverbesserungen festgestellt und dann hat es sich von unten nach oben verbreitet
      So entsteht Innovation auch in Großunternehmen
  • Ich denke, man sollte lieber das Originalvideo ansehen als den Phoronix-Artikel
    YouTube-Link
    • In dem Moment, in dem man YouTube-Videos nicht mehr als Primärquelle betrachtet, wird das Leben deutlich einfacher
    • Überraschend, Phoronix als Blog-Spam zu bezeichnen
  • Ich frage mich, welche ultraniedrigen Latenz-Workloads Meta betreibt, dass es so einen Scheduler braucht
    • Laut dem Video benötigen die Erlang-Worker von WhatsApp Latenzen im Submillisekundenbereich
    • Wahrscheinlich wegen des Anzeigenauktionssystems
    • Bei einem riesigen Unternehmen wie Meta führt Latenz direkt zu geschäftlichen Verlusten
    • Meta verfolgt immer das Ziel „so schnell wie möglich“, manchmal sogar mehr als nötig
    • Wenn man von 50.000 Servern nur 1 % einsparen kann, sind das 50 Server weniger; bei 8.000 Dollar pro Server spart man 400.000 Dollar pro Jahr
      In Metas Größenordnung ist der Spareffekt noch viel größer
  • Es ist interessant, dass Server-Workloads Ideen aus anderen Bereichen übernehmen
    Kürzlich habe ich gesehen, dass Kubernetes-spezifische Betriebssysteme Updates ähnlich wie Android ausrollen
    • Meinst du damit immutable Systeme?