gstack – Ein virtuelles Engineering-Team mit Claude Code
(github.com/garrytan)- Eine von YC-CEO Garry Tan entwickelte und genutzte Open-Source-Software-Factory aus KI, die so aufgebaut ist, dass eine Person wie ein 20-köpfiges Team arbeiten kann
- Besteht aus Slash-Commands, die den gesamten Sprint in der Reihenfolge Think → Plan → Build → Review → Test → Ship → Reflect abdecken; jeder Skill übergibt den Kontext automatisch an den nächsten Skill
- Startet mit
/office-hours, um Produktannahmen zu validieren, legt dann mit/plan-ceo-review·/plan-eng-reviewdie Architektur fest und automatisiert anschließend mit/review·/qa·/shipalles von Bugfixes bis zur PR-Erstellung - Jeder Befehl arbeitet wie ein rollenspezifischer Experte: CEO-Review, Design durch den Engineering-Manager, Design-Aufsicht, QA-Lead, Release Engineer usw.
- Zielgruppe
- Founder·CEO — technische Gründer, die weiterhin selbst Code deployen möchten
- Claude-Code-Einsteiger — Nutzer, die statt eines leeren Prompts einen strukturierten, rollenbasierten Workflow brauchen
- Tech Lead·Staff Engineer — Senior Engineers, die für jede PR strenge Reviews, QA und Release-Automatisierung benötigen
- Die Skills als Kern des Sprints
/office-hours— validiert Produktannahmen mit sechs verpflichtenden Fragen im Stil von YC Office Hours, erstellt ein Design-Dokument und übergibt es automatisch an nachgelagerte Skills/plan-ceo-review— definiert das Problem neu und erkundet ein „10-Sterne-Produkt“; vier Modi: Expansion, Selective Expansion, Hold Scope, Reduction/plan-eng-review— definiert Architektur, Datenfluss, ASCII-Diagramme, Edge Cases, Testmatrix und Sicherheitsbedenken/plan-design-review— bewertet jede Designdimension auf einer Skala von 0 bis 10 und erklärt den 10-Punkte-Standard, inklusive AI-Slop-Erkennung; zu jeder Designentscheidung wird einmal interaktivAskUserQuestionausgeführt/design-consultation— baut ein vollständiges Design-System von Grund auf und erzeugt realistische Produkt-Mockups/review— erkennt Bugs, die CI bestehen, aber in Produktion scheitern, behebt offensichtliche Probleme automatisch und markiert Qualitätslücken/investigate— Grundsatz: keine Korrektur ohne Untersuchung; verfolgt Datenflüsse, validiert Hypothesen und bricht nach drei Fehlversuchen ab/design-review— führt dasselbe Audit wie/plan-design-reviewdurch und behebt gefundene Probleme direkt; fügt Screenshots vor und nach der Korrektur an/qa— testet die App in einem echten Browser, findet und behebt Bugs und erstellt automatisch Regressions-Tests für jede Korrektur/qa-only— gleiche Methodik wie/qa, erzeugt aber nur Bug-Reports ohne Codeänderungen/cso— Audit mit OWASP Top 10 + STRIDE Threat Model; 17 Regeln zum Ausschluss von False Positives, Gate ab 8/10 Vertrauensniveau, mit konkretem Exploit-Szenario für jeden Fund/ship— synchronisiertmain, führt Tests aus, prüft Coverage, pusht und erstellt eine PR; wenn kein Test-Framework vorhanden ist, wird es automatisch gebootstrapt/land-and-deploy— erledigt PR-Merge → Warten auf CI·Deployment → Verifikation des Produktionsstatus in einem einzigen Befehl/canary— Monitoring-Schleife nach dem Deployment für Konsolenfehler, Performance-Regressionen und Seitenausfälle/benchmark— misst Baselines für Seitenladezeit, Core Web Vitals und Ressourcengröße und vergleicht Vorher/Nachher pro PR/document-release— aktualisiert die gesamte Projektdokumentation entsprechend dem ausgelieferten Stand und erkennt veraltete READMEs automatisch/retro— wöchentliche Retrospektive; individuelle Analysen, Deploy-Streaks, Trends der Testgesundheit; mit/retro globalauch eine integrierte Retrospektive über das gesamte Projekt und KI-Tools hinweg (Claude Code, Codex, Gemini)/browse— echter Chromium-Browser, echte Klicks, echte Screenshots, etwa 100 ms pro Befehl/setup-browser-cookies— importiert Cookies aus Chrome, Arc, Brave und Edge in eine Headless-Session, um authentifizierte Seiten zu testen/autoplan— führt CEO- → Design- → Engineering-Review automatisch der Reihe nach aus und zeigt dem Nutzer nur geschmacksbezogene Entscheidungen
- Power-Tools
/codex— unabhängiges Code-Review mit der OpenAI Codex CLI; drei Modi: Review (Pass/Fail-Gate), adversarial challenge und offene Konsultation; bei gemeinsamer Ausführung von/reviewund/codexerfolgt eine Cross-Model-Analyse/careful— warnt vor destruktiven Befehlen wierm -rf,DROP TABLEoder Force Push; wird durch Eingabe von „be careful“ aktiviert/freeze— beschränkt Dateibearbeitungen auf ein bestimmtes Verzeichnis, um Änderungen außerhalb des Umfangs während des Debuggings zu verhindern/guard— kombiniert/careful+/freeze, die höchste Sicherheitseinstellung für Produktionsarbeit/unfreeze— hebt die Grenzen von/freezeauf/setup-deploy— einmaliges Setup für/land-and-deploy, erkennt Plattform, Produktions-URL und Deployment-Befehl automatisch/gstack-upgrade— aktualisiert gstack auf die neueste Version und erkennt sowohl globale als auch vendorte Installationen zur Synchronisierung
- Parallele Sprints: Über Conductor können mehrere Claude-Code-Sessions gleichzeitig in isolierten Workspaces ausgeführt werden
- Beispiel: eine Session für
/office-hours, eine andere für/review, eine dritte für die Feature-Implementierung, eine vierte für/qa
— Founder, Lead Engineers und PMs können diese KI-Entwicklungsfabrik forken, selbst ausprobieren und erweitern
- Beispiel: eine Session für
- Funktioniert neben Claude Code auch mit allen Agenten, die den SKILL.md-Standard unterstützen, etwa Codex, Gemini CLI, Cursor
- MIT-Lizenz
4 Kommentare
Wow!! Garry Tan hat GeekNews retweetet.
https://x.com/garrytan/status/2035898375934300353
Da die Office Hour ziemlich lange gedauert hat, habe ich nachgeschaut — und schon allein dieses eine Markdown hat eine beachtliche Länge.
Es entwickelt sich zunehmend so, dass Menschen, die ein Ein-Personen-Unternehmen führen, es gut nutzen können.
Die office-hours sind interessant, ich bevorzuge jedoch praktische Sessions.