oh-my-ag: Ein Multi-Agenten-Orchestrator für Antigravity
(github.com/first-fluke)Im aktuellen 2026 Agentic Coding Trends Report von Claude wurde
Softwareentwicklung nicht länger als „Code direkt zu schreiben“ definiert, sondern als die Frage, wie man Agenten orchestriert und überwacht.
AI ist ein guter Kollaborateur, aber um Qualität und Sicherheit zu gewährleisten, sind menschliche Aufsicht und Validierung unverzichtbar.
Vollständige Delegation ist zwar attraktiv, doch für die Wartbarkeit braucht es eine Struktur zur Zusammenarbeit.
Das Problem ist, dass diese Kollaborationsstruktur jedes Mal manuell per Prompt aufgebaut und verwaltet werden muss.
[Warum oh-my-ag?]
Wer Antigravity oder CLI-basierte Agenten bereits in realen Projekten eingesetzt hat, dem dürften die folgenden Probleme bekannt vorkommen.
Agenten lesen Skills nicht richtig, Rules werden mitten im Gespräch ignoriert,
Antworten geraten außer Kontrolle und enden in Endlosschleifen, oder sie arbeiten fleißig, erledigen aber am Ende nicht die eigentlich angeforderte Aufgabe.
Es wirkt wie ein Modellproblem, tatsächlich war es aber ein Orchestrierungsproblem.
Deshalb wurde statt weiterer Prompt-Korrekturen die Richtung geändert.
Nicht „Wie schreibt man gute Prompts?“, sondern: „Was, wenn man die Struktur der Zusammenarbeit zwischen Agenten als Standard bereitstellt?“
Mit dieser Frage begann oh-my-ag.
[Was oh-my-ag macht]
oh-my-ag ist eine rollenbasierte Agenten-Orchestrierungsschicht für Antigravity.
Statt den gesamten Kontext in einen einzelnen Agenten zu pressen, werden die Verantwortlichkeiten klar getrennt.
Der Orchestrator steuert den gesamten Ablauf,
Sub-Agenten konzentrieren sich auf ihre jeweilige Rolle,
und notwendiger Kontext wird über einen gemeinsamen Speicher geteilt.
Für die Installation genügt diese eine Zeile.
bunx oh-my-ag
Dann wird im Projekt automatisch ein rollenbasiertes Agenten-Set eingerichtet.
- Der PM strukturiert Anforderungen und zerlegt die Arbeit in Teilaufgaben.
- Frontend und Backend übernehmen die Implementierung in ihren jeweiligen Bereichen.
- Mobile ist für mobile Implementierungen auf Flutter-Basis zuständig,
- QA prüft die Anforderungen und kontrolliert Edge Cases.
- Der Debug-Agent analysiert Fehlerursachen und schlägt Korrekturrichtungen vor.
Jeder Agent verfügt über für seine Rolle optimierte Skills und eine passende Prompt-Struktur, und der Orchestrator bündelt sie zu einem einzigen Ablauf.
[Warum man es nutzen sollte]
Erstens, um die Schwankungen der Modellleistung prozessseitig abzufedern.
In letzter Zeit kommt es häufig vor, dass sich die Leistung von Modellen wie Gemini 3 Pro durch Updates oder Serversituationen plötzlich verändert.
Eine Struktur, die von einem einzelnen Agenten und langen Prompts abhängt, ist für solche Schwankungen sehr anfällig.
oh-my-ag wurde so entworfen, dass durch aufgeteilte Rollen und getrennte Verantwortlichkeiten ein vorübergehender Leistungsabfall eines bestimmten Modells nicht das Gesamtergebnis ruiniert.
Der Orchestrator und alle Sub-Agenten verwenden Serena Memory als gemeinsamen Speicher.
Da Entscheidungen und Zwischenergebnisse im Speicher akkumuliert werden, geht der Kontext selbst bei Modellwechseln oder schwankender Antwortqualität nicht so leicht verloren.
Zweitens werden die Punkte menschlicher Aufsicht klarer.
Entscheidend ist nicht, den Menschen aus dem Loop zu entfernen, sondern klar zu machen, an welchen Stellen eingegriffen werden sollte.
Da die Rollen PM, QA und Debug getrennt sind, wird strukturell sichtbar, was AI übernommen hat und an welchen Punkten menschliche Entscheidungen erforderlich sind.
Drittens lassen sich Ressourcen für das wiederholte Prompt-Management reduzieren.
Jedes Mal dieselben Rollenbeschreibungen, Regeln und Freigabeprozesse erneut per Prompt einzugeben, ist nicht produktiv.
oh-my-ag automatisiert mit rollenbasierten Skill-Bundles und einem Orchestrator mit Parallel-Ausführung die Prompt-Konfiguration und die Verbindungsstruktur als Standard.
[Hauptmerkmale]
- Rollenbasiertes Set spezialisierter Agenten
- Orchestrierungsschicht mit Unterstützung für Parallel-Ausführung
- Unterstützung für Gemini CLI / Claude CLI / Codex CLI
- Serena-Memory-Integration
- Steuerung des Tool Scope pro MCP
- Automatisierung von Conventional Commits
AI-native Entwicklung im Jahr 2026 ist nicht länger die Frage, „wie man Tools gut einsetzt“.
Diese Orchestrierung wurde unter der Annahme der Struktur von first-fluke/fullstack-starter entworfen und bewältigt in Full-Stack-Web- und Mobile-Anwendungen bereits zuverlässig mehr als 50 Commits pro Tag.
Wer Antigravity bereits nutzt, kann statt weiter mit Prompts zu ringen lieber gemeinsam mit oh-my-ag und AI Pro die Tokens von sechs Accounts verbrennen.
GitHub link 🔗
Github: first-fluke/oh-my-ag
17 Kommentare
Ich habe es so gemacht, dass sich Skills in codex, GitHub Copilot, Claude, opencode und amp alle kopieren lassen.
Oh, das ist echt der Hammer.
Die Qualität war immer gut, deshalb werde ich es vertrauensvoll ausprobieren, haha.
Vielen Dank für den netten Kommentar.
Ich habe ebenfalls einen ähnlichen Ansatz in Betracht gezogen und eine auf speckit basierende Umgebung für parallele Agenten aufgebaut. Ich denke, dass Frameworks für Spec Driven Dev perfekt zu diesem Ansatz passen — gab es einen Grund, warum Sie sie nicht übernommen haben?
Persönlich fand ich es besser, eher Autonomie zu geben, damit Richtungen entstehen können, an die ich selbst nicht gedacht hätte, statt so detaillierte Leitlinien wie bei Speckit vorzugeben. Wenn der Kontext länger wird, bricht die anfangs definierte Spezifikation teilweise auch zusammen. Bei komplexen Dingen war die Qualität besser, wenn man sie im Plan-Modus ausführt und anschließend weiter überprüft.
Ich bin Anfänger und frage mal nach~ hehe: Installiere ich das einfach und stelle dann wie bisher meine Anfragen im Antigravity-Chatfenster?
Führen Sie in Ihrem Chatfenster per Slash-Command
"/"den gewünschten Workflow aus (.agent/workflows), oder Skills werden anhand von Keywords automatisch ausgeführt.Ich habe oft erlebt, dass bei einem einzelnen Agenten Kontext verloren geht, wenn man ihm lange Prompts hineindrückt, daher scheint mir der Ansatz, das als „Orchestrierungsproblem“ zu betrachten, genau richtig zu sein.
Die Struktur mit getrennter Rollenverteilung + gemeinsamem Status über Serena Memory wirkt sauber, und da auch die Dokumentation gut ist, könnte man das direkt einsetzen.
Werde ich gern nutzen!
Sie haben es sehr gründlich geprüft … vielen Dank.
Danke. Offenbar war ich mit meiner Frustration bei der Nutzung von Antigravity als Hauptlösung nicht allein, haha.
Manchmal wird es irgendwie ziemlich dumm, haha. Danke.
Sie holen den PM wirklich geschickt an Bord 🙇♂️🙇♂️🙇♂️
Beim Lesen dachte ich die ganze Zeit, dass es am Ende wohl besser ist, für einen personalisierten Workflow nicht einfach irgendetwas herauszunehmen und zu verwenden, sondern den Absichten und der Philosophie dieser Person genau so zu folgen — so kam es mir vor! Da es wohl kein Workflow ist, der sich für den Einsatz im Unternehmen eignet, werde ich mir einfach die guten Teile herauspicken und verwenden~~
Ich würde mich freuen, wenn Sie es nach Ihrem Geschmack übernehmen könnten.
Ich wäre dankbar, wenn Sie das im Backend mit Node.js umsetzen könnten. Ich dachte, das gäbe es schon, daher war ich ein wenig enttäuscht T_T
Ich werde das zügig prüfen, damit Sie nicht enttäuscht sind!
Ich habe auch die Vorlage, die Sie letztes Mal geteilt haben, sehr gut genutzt.
Vielen Dank auch dieses Mal für das wertvolle Teilen.
Nichts Besonderes, aber danke.