94 Punkte von xguru 2026-03-23 | 4 Kommentare | Auf WhatsApp teilen
  • Eine von YC-CEO Garry Tan entwickelte und genutzte Open-Source-Software-Factory aus KI, die so aufgebaut ist, dass eine Person wie ein 20-köpfiges Team arbeiten kann
  • Besteht aus Slash-Commands, die den gesamten Sprint in der Reihenfolge Think → Plan → Build → Review → Test → Ship → Reflect abdecken; jeder Skill übergibt den Kontext automatisch an den nächsten Skill
  • Startet mit /office-hours, um Produktannahmen zu validieren, legt dann mit /plan-ceo-review · /plan-eng-review die Architektur fest und automatisiert anschließend mit /review · /qa · /ship alles von Bugfixes bis zur PR-Erstellung
  • Jeder Befehl arbeitet wie ein rollenspezifischer Experte: CEO-Review, Design durch den Engineering-Manager, Design-Aufsicht, QA-Lead, Release Engineer usw.
  • Zielgruppe
    • Founder·CEO — technische Gründer, die weiterhin selbst Code deployen möchten
    • Claude-Code-Einsteiger — Nutzer, die statt eines leeren Prompts einen strukturierten, rollenbasierten Workflow brauchen
    • Tech Lead·Staff Engineer — Senior Engineers, die für jede PR strenge Reviews, QA und Release-Automatisierung benötigen
  • Die Skills als Kern des Sprints
    • /office-hours — validiert Produktannahmen mit sechs verpflichtenden Fragen im Stil von YC Office Hours, erstellt ein Design-Dokument und übergibt es automatisch an nachgelagerte Skills
    • /plan-ceo-review — definiert das Problem neu und erkundet ein „10-Sterne-Produkt“; vier Modi: Expansion, Selective Expansion, Hold Scope, Reduction
    • /plan-eng-review — definiert Architektur, Datenfluss, ASCII-Diagramme, Edge Cases, Testmatrix und Sicherheitsbedenken
    • /plan-design-review — bewertet jede Designdimension auf einer Skala von 0 bis 10 und erklärt den 10-Punkte-Standard, inklusive AI-Slop-Erkennung; zu jeder Designentscheidung wird einmal interaktiv AskUserQuestion ausgeführt
    • /design-consultation — baut ein vollständiges Design-System von Grund auf und erzeugt realistische Produkt-Mockups
    • /review — erkennt Bugs, die CI bestehen, aber in Produktion scheitern, behebt offensichtliche Probleme automatisch und markiert Qualitätslücken
    • /investigate — Grundsatz: keine Korrektur ohne Untersuchung; verfolgt Datenflüsse, validiert Hypothesen und bricht nach drei Fehlversuchen ab
    • /design-review — führt dasselbe Audit wie /plan-design-review durch und behebt gefundene Probleme direkt; fügt Screenshots vor und nach der Korrektur an
    • /qa — testet die App in einem echten Browser, findet und behebt Bugs und erstellt automatisch Regressions-Tests für jede Korrektur
    • /qa-only — gleiche Methodik wie /qa, erzeugt aber nur Bug-Reports ohne Codeänderungen
    • /cso — Audit mit OWASP Top 10 + STRIDE Threat Model; 17 Regeln zum Ausschluss von False Positives, Gate ab 8/10 Vertrauensniveau, mit konkretem Exploit-Szenario für jeden Fund
    • /ship — synchronisiert main, führt Tests aus, prüft Coverage, pusht und erstellt eine PR; wenn kein Test-Framework vorhanden ist, wird es automatisch gebootstrapt
    • /land-and-deploy — erledigt PR-Merge → Warten auf CI·Deployment → Verifikation des Produktionsstatus in einem einzigen Befehl
    • /canary — Monitoring-Schleife nach dem Deployment für Konsolenfehler, Performance-Regressionen und Seitenausfälle
    • /benchmark — misst Baselines für Seitenladezeit, Core Web Vitals und Ressourcengröße und vergleicht Vorher/Nachher pro PR
    • /document-release — aktualisiert die gesamte Projektdokumentation entsprechend dem ausgelieferten Stand und erkennt veraltete READMEs automatisch
    • /retro — wöchentliche Retrospektive; individuelle Analysen, Deploy-Streaks, Trends der Testgesundheit; mit /retro global auch eine integrierte Retrospektive über das gesamte Projekt und KI-Tools hinweg (Claude Code, Codex, Gemini)
    • /browse — echter Chromium-Browser, echte Klicks, echte Screenshots, etwa 100 ms pro Befehl
    • /setup-browser-cookies — importiert Cookies aus Chrome, Arc, Brave und Edge in eine Headless-Session, um authentifizierte Seiten zu testen
    • /autoplan — führt CEO- → Design- → Engineering-Review automatisch der Reihe nach aus und zeigt dem Nutzer nur geschmacksbezogene Entscheidungen
  • Power-Tools
    • /codex — unabhängiges Code-Review mit der OpenAI Codex CLI; drei Modi: Review (Pass/Fail-Gate), adversarial challenge und offene Konsultation; bei gemeinsamer Ausführung von /review und /codex erfolgt eine Cross-Model-Analyse
    • /careful — warnt vor destruktiven Befehlen wie rm -rf, DROP TABLE oder Force Push; wird durch Eingabe von „be careful“ aktiviert
    • /freeze — beschränkt Dateibearbeitungen auf ein bestimmtes Verzeichnis, um Änderungen außerhalb des Umfangs während des Debuggings zu verhindern
    • /guard — kombiniert /careful + /freeze, die höchste Sicherheitseinstellung für Produktionsarbeit
    • /unfreeze — hebt die Grenzen von /freeze auf
    • /setup-deploy — einmaliges Setup für /land-and-deploy, erkennt Plattform, Produktions-URL und Deployment-Befehl automatisch
    • /gstack-upgrade — aktualisiert gstack auf die neueste Version und erkennt sowohl globale als auch vendorte Installationen zur Synchronisierung
  • Parallele Sprints: Über Conductor können mehrere Claude-Code-Sessions gleichzeitig in isolierten Workspaces ausgeführt werden
    • Beispiel: eine Session für /office-hours, eine andere für /review, eine dritte für die Feature-Implementierung, eine vierte für /qa
      — Founder, Lead Engineers und PMs können diese KI-Entwicklungsfabrik forken, selbst ausprobieren und erweitern
  • Funktioniert neben Claude Code auch mit allen Agenten, die den SKILL.md-Standard unterstützen, etwa Codex, Gemini CLI, Cursor
  • MIT-Lizenz

4 Kommentare

 
kgcrom 2026-03-23

Wow!! Garry Tan hat GeekNews retweetet.
https://x.com/garrytan/status/2035898375934300353

 
laeyoung 2026-03-25

Da die Office Hour ziemlich lange gedauert hat, habe ich nachgeschaut — und schon allein dieses eine Markdown hat eine beachtliche Länge.

 
angrybird0 2026-03-23

Es entwickelt sich zunehmend so, dass Menschen, die ein Ein-Personen-Unternehmen führen, es gut nutzen können.

 
ragingwind 2026-03-23

Die office-hours sind interessant, ich bevorzuge jedoch praktische Sessions.