Ich habe versucht, RollerCoaster Tycoon mit Claude Code zu spielen

(labs.ramp.com)

16 Punkte von GN⁺ 2026-01-19 | Noch keine Kommentare. | Auf WhatsApp teilen

Claude Code wurde in das Open-Source-Spiel RollerCoaster Tycoon 2 (OpenRCT2) integriert, um zu testen, ob eine KI tatsächlich einen Freizeitpark betreiben kann
Die KI analysierte mehr als 100 Kennzahlen wie Finanzen, Gästebeschwerden und Fahrgeschäftsausfälle und traf Managemententscheidungen wie das Aufstellen von Getränkeständen, das Einstellen von Personal und das Anpassen der Eintrittspreise automatisch
Über das CLI-Tool rctctl wurden alle Aktionen im Spiel über die Kommandozeile ausgeführt; die Struktur ist ähnlich wie bei Kubernetes kubectl
Claude zeigte Stärken bei Datenanalyse, Preisanpassungen und Personalmanagement, offenbarte jedoch Grenzen bei räumlichen Aufgaben wie Wegverbindungen, Platzierung von Achterbahnen und Geländeerkennung
Das Experiment bestätigte, dass der Schlüssel beim Agenten-Design in der Lesbarkeit der Umgebung und der Qualität der Schnittstellen liegt

Projektüberblick

Ramp Labs integrierte Claude Code in RollerCoaster Tycoon 2, um zu testen, ob eine KI den Parkbetrieb direkt übernehmen kann
- Claude analysierte rund 100 Datenpunkte im Spiel, darunter Finanzen, Gästezufriedenheit und den Zustand der Fahrgeschäfte
- Auf dieser Basis schlug die KI Maßnahmen wie zusätzliche Getränkestände, die Einstellung von Mechanikern und höhere Eintrittspreise automatisch vor
Ziel des Experiments war es, Erkenntnisse für das Design von KI-Agenten in B2B-SaaS-Umgebungen zu gewinnen
RollerCoaster Tycoon wurde ausgewählt, weil das Spiel kundenorientierten Geschäftsbetrieb und digitale Feedback-Loops abbildet

Ramp entwickelt kleine, auf einzelne Aufgaben spezialisierte Agenten und verfolgt dabei einen Ansatz, der Sicherheits- und Kontextgrenzen berücksichtigt
Gleichzeitig bestand der Wunsch, experimentell einen einzelnen Agenten mit weitreichenden Berechtigungen zu testen
RollerCoaster Tycoon bietet eine Umgebung, in der Wirtschaft, Kunden und Betriebsmanagement zusammenkommen, und ähnelt damit dem Betrieb von SaaS-Produkten
Die Benutzeroberfläche des Spiels ähnelt einem B2B-SaaS-Dashboard und passt gut zu Claudes retro-futuristischem Terminal-Interface

OpenRCT2 wurde geforkt und um ein Terminalfenster erweitert, sodass Claude das Spiel per Kommandozeile steuern konnte
Die rctctl-CLI deckt alle möglichen Benutzeraktionen ab und kommuniziert per JSON-RPC mit dem Spielzustand
Statt visueller Wahrnehmung nutzte Claude eine ASCII-Kartenausgabe, um räumliche Informationen zu erfassen

Spielwissen: Umfangreiches Wissen zu RCT und natürliche Interaktion selbst in einer Spielumgebung der 90er Jahre
Informationssammlung: Integrierte Analyse verschiedener Kennzahlen wie Gästefeedback und Finanzdaten
Digitale Bedienung: Stark bei nicht-räumlichen Aufgaben wie dem Öffnen und Schließen von Fahrgeschäften, Preisänderungen, Personaleinstellungen und Marketingmaßnahmen
Platzierung von Einrichtungen: Einfache Strukturen wie Toiletten und Getränkestände konnten zuverlässig platziert werden

Wegverbindungen: Schwierigkeiten bei räumlichen Aufgaben wie Wegfindung sowie dem Verbinden von Ein- und Ausgängen
Platzierung von Achterbahnen: Beim Aufstellen großer Fahrgeschäfte scheiterte die Erkennung von Hindernissen und Geländeformen
Räumliches 3D-Verständnis: Keine brauchbare Erkennung von Steigungen, unterirdischen Strukturen oder individuelles Design von Coastern
Insgesamt ist Claude stark bei informationsbasierter Steuerung, aber schwach bei visueller und räumlicher Bedienung

Auf Basis von OpenRCT2 (C++) wurden ein Claude-Terminalfenster, die rctctl-CLI, eine RPC-Schicht und Testcode ergänzt
Die erste Version wurde mit ChatGPT o3-Pro Deep Research geplant und später mit GPT-5.1-codex neu implementiert
Der Aufbau dauerte insgesamt mehr als 40 Stunden; als größter Engpass wurde das Fehlen eines Feedback-Loops genannt
Die QA-Effizienz wurde erhöht, indem Claude selbst Bug-Reports im Repository erstellte

Environment Legibility: Claude ist hervorragend bei klaren Datenschnittstellen, aber schwach bei textbasierten räumlichen Darstellungen
Wert von Coding-Agenten: Updates aktueller Modelle wie Claude Opus 4.5 konnten sofort genutzt werden und beschleunigten die Entwicklung
Bedeutung des Entwicklungs-Loops: Ohne automatisierten QA-Loop sinkt die Produktivität drastisch
Vorteil praktischer Erfahrung: Die beste Methode, die Arbeitsweise von LLMs zu verstehen, ist direktes Experimentieren und Ausprobieren

Erforderlich sind macOS (ab Sonoma), Xcode, CMake, Ninja und RCT2 (Originalversion)
Die rctctl-CLI nutzt eine Befehlsstruktur im kubectl-Stil, über die Claude das Spiel via JSON-RPC steuert
Build-Artefakte:
- OpenRCT2 (Version mit integriertem Terminal)
- rctctl (CLI-Tool)
- Sprite-Assets
Der vollständige Code ist auf GitHub (jaysobel/OpenRCT2) verfügbar; eine Live-Demo ist auf Twitch möglich

Claude Code zeigt zugleich das Potenzial und die Grenzen der Betriebsautomatisierung
RollerCoaster Tycoon fungiert als experimentelles Übergangsfeld zwischen grafischen Benutzeroberflächen und intelligenten Systemen
Die zentrale Erkenntnis: Erfolg oder Misserfolg von KI-Agenten hängen von der Klarheit der Umgebung und der Qualität des Interface-Designs ab