gstack – Ein virtuelles Engineering-Team mit Claude Code

xguru · 2026-03-23T10:06:01+09:00

Eine von YC-CEO Garry Tan entwickelte und genutzte Open-Source-Software-Factory aus KI, die so aufgebaut ist, dass eine Person wie ein 20-köpfiges Team arbeiten kann Besteht aus Slash-Commands, die den gesamten Sprint in der Reihenfolge Think → Plan → Build → Review → Test → Ship → Reflect abdecken; jeder Skill übergibt den Kontext automatisch an den nächsten Skill Startet mit /office-hours, um Produktannahmen zu validieren, legt dann mit /plan-ceo-review · /plan-eng-review die Architektur fest und automatisiert anschließend mit /review · /qa · /ship alles von Bugfixes bis zur PR-Erstellung Jeder Befehl arbeitet wie ein rollenspezifischer Experte: CEO-Review, Design durch den Engineering-Manager, Design-Aufsicht, QA-Lead, Release Engineer usw. Zielgruppe Founder·CEO — technische Gründer, die weiterhin selbst Code deployen möchten Claude-Code-Einsteiger — Nutzer, die statt eines leeren Prompts einen strukturierten, rollenbasierten Workflow brauchen Tech Lead·Staff Engineer — Senior Engineers, die für jede PR strenge Reviews, QA und Release-Automatisierung benötigen Die Skills als Kern des Sprints /office-hours — validiert Produktannahmen mit sechs verpflichtenden Fragen im Stil von YC Office Hours, erstellt ein Design-Dokument und übergibt es automatisch an nachgelagerte Skills /plan-ceo-review — definiert das Problem neu und erkundet ein „10-Sterne-Produkt“; vier Modi: Expansion, Selective Expansion, Hold Scope, Reduction /plan-eng-review — definiert Architektur, Datenfluss, ASCII-Diagramme, Edge Cases, Testmatrix und Sicherheitsbedenken /plan-design-review — bewertet jede Designdimension auf einer Skala von 0 bis 10 und erklärt den 10-Punkte-Standard, inklusive AI-Slop-Erkennung; zu jeder Designentscheidung wird einmal interaktiv AskUserQuestion ausgeführt /design-consultation — baut ein vollständiges Design-System von Grund auf und erzeugt realistische Produkt-Mockups /review — erkennt Bugs, die CI bestehen, aber in Produktion scheitern, behebt offensichtliche Probleme automatisch und markiert Qualitätslücken /investigate — Grundsatz: keine Korrektur ohne Untersuchung; verfolgt Datenflüsse, validiert Hypothesen und bricht nach drei Fehlversuchen ab /design-review — führt dasselbe Audit wie /plan-design-review durch und behebt gefundene Probleme direkt; fügt Screenshots vor und nach der Korrektur an /qa — testet die App in einem echten Browser, findet und behebt Bugs und erstellt automatisch Regressions-Tests für jede Korrektur /qa-only — gleiche Methodik wie /qa, erzeugt aber nur Bug-Reports ohne Codeänderungen /cso — Audit mit OWASP Top 10 + STRIDE Threat Model; 17 Regeln zum Ausschluss von False Positives, Gate ab 8/10 Vertrauensniveau, mit konkretem Exploit-Szenario für jeden Fund /ship — synchronisiert main, führt Tests aus, prüft Coverage, pusht und erstellt eine PR; wenn kein Test-Framework vorhanden ist, wird es automatisch gebootstrapt /land-and-deploy — erledigt PR-Merge → Warten auf CI·Deployment → Verifikation des Produktionsstatus in einem einzigen Befehl /canary — Monitoring-Schleife nach dem Deployment für Konsolenfehler, Performance-Regressionen und Seitenausfälle /benchmark — misst Baselines für Seitenladezeit, Core Web Vitals und Ressourcengröße und vergleicht Vorher/Nachher pro PR /document-release — aktualisiert die gesamte Projektdokumentation entsprechend dem ausgelieferten Stand und erkennt veraltete READMEs automatisch /retro — wöchentliche Retrospektive; individuelle Analysen, Deploy-Streaks, Trends der Testgesundheit; mit /retro global auch eine integrierte Retrospektive über das gesamte Projekt und KI-Tools hinweg (Claude Code, Codex, Gemini) /browse — echter Chromium-Browser, echte Klicks, echte Screenshots, etwa 100 ms pro Befehl /setup-browser-cookies — importiert Cookies aus Chrome, Arc, Brave und Edge in eine Headless-Session, um authentifizierte Seiten zu testen /autoplan — führt CEO- → Design- → Engineering-Review automatisch der Reihe nach aus und zeigt dem Nutzer nur geschmacksbezogene Entscheidungen Power-Tools /codex — unabhängiges Code-Review mit der OpenAI Codex CLI; drei Modi: Review (Pass/Fail-Gate), adversarial challenge und offene Konsultation; bei gemeinsamer Ausführung von /review und /codex erfolgt eine Cross-Model-Analyse /careful — warnt vor destruktiven Befehlen wie rm -rf, DROP TABLE oder Force Push; wird durch Eingabe von „be careful“ aktiviert /freeze — beschränkt Dateibearbeitungen auf ein bestimmtes Verzeichnis, um Änderungen außerhalb des Umfangs während des Debuggings zu verhindern /guard — kombiniert /careful + /freeze, die höchste Sicherheitseinstellung für Produktionsarbeit /unfreeze — hebt die Grenzen von /freeze auf /setup-deploy — einmaliges Setup für /land-and-deploy, erkennt Plattform, Produktions-URL und Deployment-Befehl automatisch /gstack-upgrade — aktualisiert gstack auf die neueste Version und erkennt sowohl globale als auch vendorte Installationen zur Synchronisierung Parallele Sprints: Über Conductor können mehrere Claude-Code-Sessions gleichzeitig in isolierten Workspaces ausgeführt werden Beispiel: eine Session für /office-hours, eine andere für /review, eine dritte für die Feature-Implementierung, eine vierte für /qa — Founder, Lead Engineers und PMs können diese KI-Entwicklungsfabrik forken, selbst ausprobieren und erweitern Funktioniert neben Claude Code auch mit allen Agenten, die den SKILL.md-Standard unterstützen, etwa Codex, Gemini CLI, Cursor MIT-Lizenz

Eine von YC-CEO Garry Tan entwickelte und genutzte Open-Source-Software-Factory aus KI, die so aufgebaut ist, dass eine Person wie ein 20-köpfiges Team arbeiten kann
Besteht aus Slash-Commands, die den gesamten Sprint in der Reihenfolge Think → Plan → Build → Review → Test → Ship → Reflect abdecken; jeder Skill übergibt den Kontext automatisch an den nächsten Skill
Startet mit /office-hours, um Produktannahmen zu validieren, legt dann mit /plan-ceo-review · /plan-eng-review die Architektur fest und automatisiert anschließend mit /review · /qa · /ship alles von Bugfixes bis zur PR-Erstellung
Jeder Befehl arbeitet wie ein rollenspezifischer Experte: CEO-Review, Design durch den Engineering-Manager, Design-Aufsicht, QA-Lead, Release Engineer usw.
Zielgruppe
- Founder·CEO — technische Gründer, die weiterhin selbst Code deployen möchten
- Claude-Code-Einsteiger — Nutzer, die statt eines leeren Prompts einen strukturierten, rollenbasierten Workflow brauchen
- Tech Lead·Staff Engineer — Senior Engineers, die für jede PR strenge Reviews, QA und Release-Automatisierung benötigen
Die Skills als Kern des Sprints
- /office-hours — validiert Produktannahmen mit sechs verpflichtenden Fragen im Stil von YC Office Hours, erstellt ein Design-Dokument und übergibt es automatisch an nachgelagerte Skills
- /plan-ceo-review — definiert das Problem neu und erkundet ein „10-Sterne-Produkt“; vier Modi: Expansion, Selective Expansion, Hold Scope, Reduction
- /plan-eng-review — definiert Architektur, Datenfluss, ASCII-Diagramme, Edge Cases, Testmatrix und Sicherheitsbedenken
- /plan-design-review — bewertet jede Designdimension auf einer Skala von 0 bis 10 und erklärt den 10-Punkte-Standard, inklusive AI-Slop-Erkennung; zu jeder Designentscheidung wird einmal interaktiv AskUserQuestion ausgeführt
- /design-consultation — baut ein vollständiges Design-System von Grund auf und erzeugt realistische Produkt-Mockups
- /review — erkennt Bugs, die CI bestehen, aber in Produktion scheitern, behebt offensichtliche Probleme automatisch und markiert Qualitätslücken
- /investigate — Grundsatz: keine Korrektur ohne Untersuchung; verfolgt Datenflüsse, validiert Hypothesen und bricht nach drei Fehlversuchen ab
- /design-review — führt dasselbe Audit wie /plan-design-review durch und behebt gefundene Probleme direkt; fügt Screenshots vor und nach der Korrektur an
- /qa — testet die App in einem echten Browser, findet und behebt Bugs und erstellt automatisch Regressions-Tests für jede Korrektur
- /qa-only — gleiche Methodik wie /qa, erzeugt aber nur Bug-Reports ohne Codeänderungen
- /cso — Audit mit OWASP Top 10 + STRIDE Threat Model; 17 Regeln zum Ausschluss von False Positives, Gate ab 8/10 Vertrauensniveau, mit konkretem Exploit-Szenario für jeden Fund
- /ship — synchronisiert main, führt Tests aus, prüft Coverage, pusht und erstellt eine PR; wenn kein Test-Framework vorhanden ist, wird es automatisch gebootstrapt
- /land-and-deploy — erledigt PR-Merge → Warten auf CI·Deployment → Verifikation des Produktionsstatus in einem einzigen Befehl
- /canary — Monitoring-Schleife nach dem Deployment für Konsolenfehler, Performance-Regressionen und Seitenausfälle
- /benchmark — misst Baselines für Seitenladezeit, Core Web Vitals und Ressourcengröße und vergleicht Vorher/Nachher pro PR
- /document-release — aktualisiert die gesamte Projektdokumentation entsprechend dem ausgelieferten Stand und erkennt veraltete READMEs automatisch
- /retro — wöchentliche Retrospektive; individuelle Analysen, Deploy-Streaks, Trends der Testgesundheit; mit /retro global auch eine integrierte Retrospektive über das gesamte Projekt und KI-Tools hinweg (Claude Code, Codex, Gemini)
- /browse — echter Chromium-Browser, echte Klicks, echte Screenshots, etwa 100 ms pro Befehl
- /setup-browser-cookies — importiert Cookies aus Chrome, Arc, Brave und Edge in eine Headless-Session, um authentifizierte Seiten zu testen
- /autoplan — führt CEO- → Design- → Engineering-Review automatisch der Reihe nach aus und zeigt dem Nutzer nur geschmacksbezogene Entscheidungen
Power-Tools
- /codex — unabhängiges Code-Review mit der OpenAI Codex CLI; drei Modi: Review (Pass/Fail-Gate), adversarial challenge und offene Konsultation; bei gemeinsamer Ausführung von /review und /codex erfolgt eine Cross-Model-Analyse
- /careful — warnt vor destruktiven Befehlen wie rm -rf, DROP TABLE oder Force Push; wird durch Eingabe von „be careful“ aktiviert
- /freeze — beschränkt Dateibearbeitungen auf ein bestimmtes Verzeichnis, um Änderungen außerhalb des Umfangs während des Debuggings zu verhindern
- /guard — kombiniert /careful + /freeze, die höchste Sicherheitseinstellung für Produktionsarbeit
- /unfreeze — hebt die Grenzen von /freeze auf
- /setup-deploy — einmaliges Setup für /land-and-deploy, erkennt Plattform, Produktions-URL und Deployment-Befehl automatisch
- /gstack-upgrade — aktualisiert gstack auf die neueste Version und erkennt sowohl globale als auch vendorte Installationen zur Synchronisierung
Parallele Sprints: Über Conductor können mehrere Claude-Code-Sessions gleichzeitig in isolierten Workspaces ausgeführt werden
- Beispiel: eine Session für /office-hours, eine andere für /review, eine dritte für die Feature-Implementierung, eine vierte für /qa
  — Founder, Lead Engineers und PMs können diese KI-Entwicklungsfabrik forken, selbst ausprobieren und erweitern
Funktioniert neben Claude Code auch mit allen Agenten, die den SKILL.md-Standard unterstützen, etwa Codex, Gemini CLI, Cursor
MIT-Lizenz

gstack – Ein virtuelles Engineering-Team mit Claude Code

Verwandte Beiträge

4 Kommentare