16 Punkte von GN⁺ 2026-01-19 | Noch keine Kommentare. | Auf WhatsApp teilen
  • Claude Code wurde in das Open-Source-Spiel RollerCoaster Tycoon 2 (OpenRCT2) integriert, um zu testen, ob eine KI tatsächlich einen Freizeitpark betreiben kann
  • Die KI analysierte mehr als 100 Kennzahlen wie Finanzen, Gästebeschwerden und Fahrgeschäftsausfälle und traf Managemententscheidungen wie das Aufstellen von Getränkeständen, das Einstellen von Personal und das Anpassen der Eintrittspreise automatisch
  • Über das CLI-Tool rctctl wurden alle Aktionen im Spiel über die Kommandozeile ausgeführt; die Struktur ist ähnlich wie bei Kubernetes kubectl
  • Claude zeigte Stärken bei Datenanalyse, Preisanpassungen und Personalmanagement, offenbarte jedoch Grenzen bei räumlichen Aufgaben wie Wegverbindungen, Platzierung von Achterbahnen und Geländeerkennung
  • Das Experiment bestätigte, dass der Schlüssel beim Agenten-Design in der Lesbarkeit der Umgebung und der Qualität der Schnittstellen liegt

Projektüberblick

  • Ramp Labs integrierte Claude Code in RollerCoaster Tycoon 2, um zu testen, ob eine KI den Parkbetrieb direkt übernehmen kann
    • Claude analysierte rund 100 Datenpunkte im Spiel, darunter Finanzen, Gästezufriedenheit und den Zustand der Fahrgeschäfte
    • Auf dieser Basis schlug die KI Maßnahmen wie zusätzliche Getränkestände, die Einstellung von Mechanikern und höhere Eintrittspreise automatisch vor
  • Ziel des Experiments war es, Erkenntnisse für das Design von KI-Agenten in B2B-SaaS-Umgebungen zu gewinnen
  • RollerCoaster Tycoon wurde ausgewählt, weil das Spiel kundenorientierten Geschäftsbetrieb und digitale Feedback-Loops abbildet

Warum RollerCoaster Tycoon?

  • Ramp entwickelt kleine, auf einzelne Aufgaben spezialisierte Agenten und verfolgt dabei einen Ansatz, der Sicherheits- und Kontextgrenzen berücksichtigt
  • Gleichzeitig bestand der Wunsch, experimentell einen einzelnen Agenten mit weitreichenden Berechtigungen zu testen
  • RollerCoaster Tycoon bietet eine Umgebung, in der Wirtschaft, Kunden und Betriebsmanagement zusammenkommen, und ähnelt damit dem Betrieb von SaaS-Produkten
  • Die Benutzeroberfläche des Spiels ähnelt einem B2B-SaaS-Dashboard und passt gut zu Claudes retro-futuristischem Terminal-Interface

Claudes Fähigkeiten und Grenzen

  • OpenRCT2 wurde geforkt und um ein Terminalfenster erweitert, sodass Claude das Spiel per Kommandozeile steuern konnte
  • Die rctctl-CLI deckt alle möglichen Benutzeraktionen ab und kommuniziert per JSON-RPC mit dem Spielzustand
  • Statt visueller Wahrnehmung nutzte Claude eine ASCII-Kartenausgabe, um räumliche Informationen zu erfassen

Claudes Stärken

  • Spielwissen: Umfangreiches Wissen zu RCT und natürliche Interaktion selbst in einer Spielumgebung der 90er Jahre
  • Informationssammlung: Integrierte Analyse verschiedener Kennzahlen wie Gästefeedback und Finanzdaten
  • Digitale Bedienung: Stark bei nicht-räumlichen Aufgaben wie dem Öffnen und Schließen von Fahrgeschäften, Preisänderungen, Personaleinstellungen und Marketingmaßnahmen
  • Platzierung von Einrichtungen: Einfache Strukturen wie Toiletten und Getränkestände konnten zuverlässig platziert werden

Claudes Schwächen

  • Wegverbindungen: Schwierigkeiten bei räumlichen Aufgaben wie Wegfindung sowie dem Verbinden von Ein- und Ausgängen
  • Platzierung von Achterbahnen: Beim Aufstellen großer Fahrgeschäfte scheiterte die Erkennung von Hindernissen und Geländeformen
  • Räumliches 3D-Verständnis: Keine brauchbare Erkennung von Steigungen, unterirdischen Strukturen oder individuelles Design von Coastern
  • Insgesamt ist Claude stark bei informationsbasierter Steuerung, aber schwach bei visueller und räumlicher Bedienung

Build-Prozess

  • Auf Basis von OpenRCT2 (C++) wurden ein Claude-Terminalfenster, die rctctl-CLI, eine RPC-Schicht und Testcode ergänzt
  • Die erste Version wurde mit ChatGPT o3-Pro Deep Research geplant und später mit GPT-5.1-codex neu implementiert
  • Der Aufbau dauerte insgesamt mehr als 40 Stunden; als größter Engpass wurde das Fehlen eines Feedback-Loops genannt
  • Die QA-Effizienz wurde erhöht, indem Claude selbst Bug-Reports im Repository erstellte

Wichtige Erkenntnisse

  • Environment Legibility: Claude ist hervorragend bei klaren Datenschnittstellen, aber schwach bei textbasierten räumlichen Darstellungen
  • Wert von Coding-Agenten: Updates aktueller Modelle wie Claude Opus 4.5 konnten sofort genutzt werden und beschleunigten die Entwicklung
  • Bedeutung des Entwicklungs-Loops: Ohne automatisierten QA-Loop sinkt die Produktivität drastisch
  • Vorteil praktischer Erfahrung: Die beste Methode, die Arbeitsweise von LLMs zu verstehen, ist direktes Experimentieren und Ausprobieren

Ausführung und Open-Source-Informationen

  • Erforderlich sind macOS (ab Sonoma), Xcode, CMake, Ninja und RCT2 (Originalversion)
  • Die rctctl-CLI nutzt eine Befehlsstruktur im kubectl-Stil, über die Claude das Spiel via JSON-RPC steuert
  • Build-Artefakte:
    • OpenRCT2 (Version mit integriertem Terminal)
    • rctctl (CLI-Tool)
    • Sprite-Assets
  • Der vollständige Code ist auf GitHub (jaysobel/OpenRCT2) verfügbar; eine Live-Demo ist auf Twitch möglich

Fazit

  • Claude Code zeigt zugleich das Potenzial und die Grenzen der Betriebsautomatisierung
  • RollerCoaster Tycoon fungiert als experimentelles Übergangsfeld zwischen grafischen Benutzeroberflächen und intelligenten Systemen
  • Die zentrale Erkenntnis: Erfolg oder Misserfolg von KI-Agenten hängen von der Klarheit der Umgebung und der Qualität des Interface-Designs ab

Noch keine Kommentare.

Noch keine Kommentare.