- Ein langlaufendes AI-Loop-System, das wiederholt eine Aufgabenliste durchläuft und sie bis zur Fertigstellung ausführt
- Führt AI-CLIs wie Claude Code/Codex/Gemini sicher in einer Docker-Sandbox-Umgebung aus
- Vorgehensweise
- Schritt 1: Ralph installieren:
npx @pageai/ralph-loop
- Schritt 2: PRD (Product Requirements Document) und Aufgabenliste erstellen: Mit dem Skill
prd-creator aus Anforderungen ein PRD erzeugen und jede Aufgabe prüfen
- Schritt 3: Agent in der Docker-Sandbox einrichten
- Mit
docker sandbox run claude . anmelden
- Bei
Bypass Permissions mode unbedingt Yes wählen. Das ist der Grund für die Nutzung der Sandbox
- Schritt 4: Ralph starten:
./ralph.sh -n 50 # Ralph Loop 50-mal wiederholt ausführen
- Funktionsweise: In jedem Durchlauf führt Ralph die folgenden Aufgaben aus
- 1. Sucht in der Datei
.agent/tasks.json nach der unvollständigen Aufgabe mit der höchsten Priorität
- 2. Führt die in
.agent/tasks/TASK-{ID}.json definierten Arbeitsschritte der Reihe nach aus
- 3. Führt Tests, Linting und Type-Checks aus
- 4. Schließt die Aufgabe ab, nimmt einen Screenshot auf, aktualisiert den Aufgabenstatus und committet die Änderungen
- Was diese PageAI-Version von anderen Ralph Wiggum Loops unterscheidet
- PRD-Erstellung und Extraktion der Aufgabenliste aus Anforderungen
- Erstellung einer Task-Lookup-Tabelle aus dem PRD
- Aufschlüsselung von Arbeitsschritten und Aufteilung in handhabbare Schritte
- Nachverfolgung des Fortschritts über mehrere Durchläufe hinweg (mit Zeitangaben)
- Vorschau des Echtzeit-Ausgabestreams und Erkennung der Aktivitätsphase (Thinking, Testing usw.)
- Aufnahme eines Screenshots des aktuellen Bildschirms
- Benachrichtigungen, wenn menschliche Eingaben erforderlich sind
- History-Logging mit sauberer Ausgabe für jeden Durchlauf
- Anzeige von Zeitmetriken für jeden Durchlauf und die Gesamtzeit
- Mit der Steering-Funktion können wichtige Aufgaben priorisiert werden
- Zusätzlich
- Bei Eingabe unstrukturierter Anforderungen erstellt der Agent automatisch ein PRD und eine Aufgabenliste
- Durch die Nutzung einer Task-Lookup-Tabelle mit einzelnen detaillierten Schritten ist das System hoch skalierbar, wenn Hunderte von Aufgaben verarbeitet werden müssen
- Ausführung in einer Sandbox-Umgebung für höhere Sicherheit
- Fortschritt und Statistiken werden angezeigt, sodass sich abgeschlossene Aufgaben leicht erkennen lassen
- Der Agent wird angewiesen, automatisierte Tests und Screenshots pro Aufgabe zu erstellen und auszuführen
- Bietet Sichtbarkeit und Nachverfolgbarkeit für die Arbeit des Agenten
- Zeigt den Ausgabestream an und erfasst vollständige Verlaufslogs für jede Iteration
- MIT-Lizenz
Noch keine Kommentare.