- Eine von YC-CEO Garry Tan entwickelte und genutzte Open-Source-Software-Factory aus KI, die so aufgebaut ist, dass eine Person wie ein 20-köpfiges Team arbeiten kann
- Besteht aus Slash-Commands, die den gesamten Sprint in der Reihenfolge Think → Plan → Build → Review → Test → Ship → Reflect abdecken; jeder Skill übergibt den Kontext automatisch an den nächsten Skill
- Startet mit
/office-hours, um Produktannahmen zu validieren, legt dann mit /plan-ceo-review · /plan-eng-review die Architektur fest und automatisiert anschließend mit /review · /qa · /ship alles von Bugfixes bis zur PR-Erstellung
- Jeder Befehl arbeitet wie ein rollenspezifischer Experte: CEO-Review, Design durch den Engineering-Manager, Design-Aufsicht, QA-Lead, Release Engineer usw.
- Zielgruppe
- Founder·CEO — technische Gründer, die weiterhin selbst Code deployen möchten
- Claude-Code-Einsteiger — Nutzer, die statt eines leeren Prompts einen strukturierten, rollenbasierten Workflow brauchen
- Tech Lead·Staff Engineer — Senior Engineers, die für jede PR strenge Reviews, QA und Release-Automatisierung benötigen
- Die Skills als Kern des Sprints
/office-hours — validiert Produktannahmen mit sechs verpflichtenden Fragen im Stil von YC Office Hours, erstellt ein Design-Dokument und übergibt es automatisch an nachgelagerte Skills
/plan-ceo-review — definiert das Problem neu und erkundet ein „10-Sterne-Produkt“; vier Modi: Expansion, Selective Expansion, Hold Scope, Reduction
/plan-eng-review — definiert Architektur, Datenfluss, ASCII-Diagramme, Edge Cases, Testmatrix und Sicherheitsbedenken
/plan-design-review — bewertet jede Designdimension auf einer Skala von 0 bis 10 und erklärt den 10-Punkte-Standard, inklusive AI-Slop-Erkennung; zu jeder Designentscheidung wird einmal interaktiv AskUserQuestion ausgeführt
/design-consultation — baut ein vollständiges Design-System von Grund auf und erzeugt realistische Produkt-Mockups
/review — erkennt Bugs, die CI bestehen, aber in Produktion scheitern, behebt offensichtliche Probleme automatisch und markiert Qualitätslücken
/investigate — Grundsatz: keine Korrektur ohne Untersuchung; verfolgt Datenflüsse, validiert Hypothesen und bricht nach drei Fehlversuchen ab
/design-review — führt dasselbe Audit wie /plan-design-review durch und behebt gefundene Probleme direkt; fügt Screenshots vor und nach der Korrektur an
/qa — testet die App in einem echten Browser, findet und behebt Bugs und erstellt automatisch Regressions-Tests für jede Korrektur
/qa-only — gleiche Methodik wie /qa, erzeugt aber nur Bug-Reports ohne Codeänderungen
/cso — Audit mit OWASP Top 10 + STRIDE Threat Model; 17 Regeln zum Ausschluss von False Positives, Gate ab 8/10 Vertrauensniveau, mit konkretem Exploit-Szenario für jeden Fund
/ship — synchronisiert main, führt Tests aus, prüft Coverage, pusht und erstellt eine PR; wenn kein Test-Framework vorhanden ist, wird es automatisch gebootstrapt
/land-and-deploy — erledigt PR-Merge → Warten auf CI·Deployment → Verifikation des Produktionsstatus in einem einzigen Befehl
/canary — Monitoring-Schleife nach dem Deployment für Konsolenfehler, Performance-Regressionen und Seitenausfälle
/benchmark — misst Baselines für Seitenladezeit, Core Web Vitals und Ressourcengröße und vergleicht Vorher/Nachher pro PR
/document-release — aktualisiert die gesamte Projektdokumentation entsprechend dem ausgelieferten Stand und erkennt veraltete READMEs automatisch
/retro — wöchentliche Retrospektive; individuelle Analysen, Deploy-Streaks, Trends der Testgesundheit; mit /retro global auch eine integrierte Retrospektive über das gesamte Projekt und KI-Tools hinweg (Claude Code, Codex, Gemini)
/browse — echter Chromium-Browser, echte Klicks, echte Screenshots, etwa 100 ms pro Befehl
/setup-browser-cookies — importiert Cookies aus Chrome, Arc, Brave und Edge in eine Headless-Session, um authentifizierte Seiten zu testen
/autoplan — führt CEO- → Design- → Engineering-Review automatisch der Reihe nach aus und zeigt dem Nutzer nur geschmacksbezogene Entscheidungen
- Power-Tools
/codex — unabhängiges Code-Review mit der OpenAI Codex CLI; drei Modi: Review (Pass/Fail-Gate), adversarial challenge und offene Konsultation; bei gemeinsamer Ausführung von /review und /codex erfolgt eine Cross-Model-Analyse
/careful — warnt vor destruktiven Befehlen wie rm -rf, DROP TABLE oder Force Push; wird durch Eingabe von „be careful“ aktiviert
/freeze — beschränkt Dateibearbeitungen auf ein bestimmtes Verzeichnis, um Änderungen außerhalb des Umfangs während des Debuggings zu verhindern
/guard — kombiniert /careful + /freeze, die höchste Sicherheitseinstellung für Produktionsarbeit
/unfreeze — hebt die Grenzen von /freeze auf
/setup-deploy — einmaliges Setup für /land-and-deploy, erkennt Plattform, Produktions-URL und Deployment-Befehl automatisch
/gstack-upgrade — aktualisiert gstack auf die neueste Version und erkennt sowohl globale als auch vendorte Installationen zur Synchronisierung
- Parallele Sprints: Über Conductor können mehrere Claude-Code-Sessions gleichzeitig in isolierten Workspaces ausgeführt werden
- Beispiel: eine Session für
/office-hours, eine andere für /review, eine dritte für die Feature-Implementierung, eine vierte für /qa
— Founder, Lead Engineers und PMs können diese KI-Entwicklungsfabrik forken, selbst ausprobieren und erweitern
- Funktioniert neben Claude Code auch mit allen Agenten, die den SKILL.md-Standard unterstützen, etwa Codex, Gemini CLI, Cursor
- MIT-Lizenz
4 Kommentare
Wow!! Garry Tan hat GeekNews retweetet.
https://x.com/garrytan/status/2035898375934300353
Da die Office Hour ziemlich lange gedauert hat, habe ich nachgeschaut — und schon allein dieses eine Markdown hat eine beachtliche Länge.
Es entwickelt sich zunehmend so, dass Menschen, die ein Ein-Personen-Unternehmen führen, es gut nutzen können.
Die office-hours sind interessant, ich bevorzuge jedoch praktische Sessions.