- Mit dem einfachen Befehl „Richte ein Harness für mich ein“ entwirft ein Meta-Skill ein zum jeweiligen Bereich passendes spezialisiertes Agenten-Team und erstellt sogar die von den Agenten verwendeten Skills automatisch
- Unterstützt 6 Architektur-Patterns und umfasst Orchestrierung zwischen Agenten sowie Error-Handling-Protokolle
- Architektur-Patterns
- Pipeline: sequentiell abhängige Aufgaben
- Fan-out/Fan-in: parallele unabhängige Aufgaben
- Experten-Pool: situationsabhängige Auswahl und Aufruf
- Generieren–Validieren: Erzeugung mit anschließender Qualitätsprüfung
- Supervisor: ein zentraler Agent verteilt Aufgaben dynamisch
- Hierarchische Delegation: rekursive Delegation von oben nach unten
- 6-stufiger Workflow: Domänenanalyse → Entwurf der Team-Architektur (Agenten-Team vs. Sub-Agenten) → Generierung von Agentendefinitionen → Skill-Erstellung → Integration und Orchestrierung → Validierung und Tests
- Es gibt zwei Ausführungsmodi:
- Agenten-Team (Standard): TeamCreate + SendMessage + TaskCreate, empfohlen wenn 2 oder mehr Agenten und Zusammenarbeit nötig sind
- Sub-Agenten: direkter Aufruf des Agent-Tools, geeignet für einmalige Aufgaben ohne Kommunikationsbedarf
- Beim Ausführen von Harness werden Agentendefinitionsdateien unter
.claude/agents/ (z. B. analyst.md, builder.md, qa.md) und Skill-Dateien unter .claude/skills/ automatisch erzeugt
- Beispiele für mögliche Team-Konfigurationen
- Deep Research —
Richte ein Research-Harness für mich ein. Ich brauche ein Agenten-Team, das jedes Thema aus mehreren Perspektiven untersuchen kann — Websuche, wissenschaftliche Quellen, Reaktionen aus Communities — und nach Kreuzvalidierung einen Gesamtbericht erstellt.
- Website-Erstellung —
Richte ein Harness für die Full-Stack-Website-Entwicklung für mich ein. Ein Team, das Design, Frontend (React/Next.js), Backend (API) und QA-Tests von Wireframe bis Deployment als Pipeline koordiniert.
- Webtoon-Erstellung —
Richte ein Harness für die Erstellung von Webtoon-Episoden für mich ein. Ich brauche Agenten für Story-Schreiben, Prompts für Charakterdesign, Planung des Panel-Layouts und Bearbeitung der Dialoge, und sie sollen die Arbeit der jeweils anderen auf stilistische Konsistenz prüfen.
- YouTube-Content-Planung —
Richte ein Harness für die Erstellung von YouTube-Content für mich ein. Ein Team, in dem ein Supervisor-Agent Trend-Recherche, Skript-Erstellung, SEO-Optimierung für Titel/Tags und die Planung von Thumbnail-Konzepten koordiniert.
- Code-Review —
Richte ein umfassendes Code-Review-Harness für mich ein. Ein Team, in dem Agenten Architektur, Sicherheitslücken, Performance-Engpässe und Code-Stil parallel prüfen und die Ergebnisse in einem einzigen Bericht zusammenführen.
- Technische Dokumentation —
Richte ein Harness ein, das in dieser Codebasis automatisch API-Dokumentation erzeugt. Ein Team, das Endpunktanalyse, Beschreibungserstellung, Generierung von Nutzungsbeispielen und Vollständigkeitsprüfung als Pipeline verarbeitet.
- Design von Datenpipelines —
Richte ein Harness für das Design von Datenpipelines für mich ein. Ein Agenten-Team, das Schema-Design, ETL-Logik, Regeln zur Datenvalidierung und Monitoring-Setup hierarchisch delegiert.
- Marketing-Kampagne —
Richte ein Harness für die Erstellung einer Marketing-Kampagne für mich ein. Ein Team, das Zielmarktrecherche, Werbetext-Erstellung, Design visueller Konzepte und A/B-Test-Planung mit iterativen Qualitätsreviews durchführt.
- revfactory/harness-100 — veröffentlicht 100 produktionsreife Agenten-Team-Harnesses für 10 Domänen (200 Pakete in Koreanisch und Englisch)
- Jedes Harness enthält 4–5 spezialisierte Agenten, Orchestrator-Skills und domänenspezifische Skills
- Besteht aus 1.808 Markdown-Dateien für Content-Erstellung, Softwareentwicklung, Daten/AI, Geschäftsstrategie, Bildung, Recht, Gesundheitswesen usw.
- Alle wurden mit dem Harness-Plugin erzeugt
- Die Agenten-Team-Funktion von Claude Code muss aktiviert sein:
CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1
7 Kommentare
Das Ergebnis aus der tatsächlichen Nutzung ist enorm. Die von Minho entwickelte Struktur von Harness selbst arbeitet mit Fan-in/out, erzeugt mehrere auf die Instruktionen abgestimmte Multi-Agenten je nach Ziel und ein Orchestrator verwaltet sie, indem er jeden Arbeitsschritt in mehrere Phasen zerlegt und ausführt.
Die Qualität der Ergebnisse liegt auf semiprofessionellem Niveau; das kann ein Bericht sein oder sogar eine Anwendung, und dafür arbeiten Agenten in verschiedenen Rollen wie Coder, Tester, Reviewer und Analysten auf hohem Niveau.
Wie bei MCP oder anderen Tools könnte man denken, dass durch Harness der Kontext dauerhaft sehr groß bleibt und Tokens schnell verbraucht werden, aber wenn man den Kontext öffnet, sieht man, dass es mit maximaler Effizienz genutzt wird. Wenn wir allerdings die Lesbarkeit oder ein elegantes Ergebnis erreichen wollen, das wir uns vorstellen, müssen wir ein auf der Gemini API basierendes Skill zur Bildgenerierung mit Nano Banana erstellen und anhängen.
Selbst mit Claude Max 200 liegt das Daily Limit vermutlich nach 1 bis 2 Stunden, und ich habe Opus verwendet.
Ich habe ihm einen Reiseplan für Japan gegeben und darum gebeten, als Japan-Reiseführer eine interaktive Reiseseite zu erstellen. Das ist das Ergebnis. So etwas verbraucht nicht viele Tokens und ist schnell erstellt.
http://namojo.github.io/tokyo-tour
Hat das schon jemand ausprobiert? Bitte teilt eure Erfahrungen.
Das wurde von Hwang Min-ho, dem Leiter des Kakao-AI-Native-Strategieteams, entwickelt.
Ich habe schon ein paar Beiträge gesehen, in denen er es vorgestellt hat, und darauf gewartet, wann es veröffentlicht wird.
Ich werde es mal ausprobieren!
Wenn man bereits das Claude Code Agent Team verwendet hat, gab es nichts besonders Neues.
Praktisch war jedoch, die Infrastruktur mit Agents oder Skills so aufzubauen, dass sich Teamkonfigurationsinformationen und Ähnliches auch in neuen Sitzungen weiterverwenden lassen.
Wenn man das Team manuell zusammengestellt hat, wiederholten sich boilerplateartige Dinge für das Team nämlich immer wieder.
Es gab allerdings ein Problem: Da die Umgebung sowohl Subagents als auch Agent Teams berücksichtigt, kommt es im Supervisor-Muster oft zu der seltsamen Situation, dass der Supervisor Aufgaben an einen Subagent delegiert, obwohl bereits ein Team erstellt wurde.
Es sind zwar maximal 100, aber gleich nach dem Start wurde schon das Token-Limit erreicht. T_T
Ich habe mir die Zeit genommen und die umgesetzten Inhalte zusammenzufassen. Ich habe es tatsächlich auf das VibeCoding-Monorepo angewendet.
Unter Mode A (Entwicklung), B (Code-Audit) und C (Integration: A+B) habe ich es für ein bereits laufendes Projekt in Mode B durchgeführt.
Dabei konnten Punkte entdeckt werden, die durch statische Analyse nicht erfasst werden, etwa Typinkonsistenzen zwischen Frontend und Backend.
Ich habe den Anwendungsprozess zusammengefasst.
https://blog.neocode24.com/blog/claude-code-harness-real-world/
Da ich selbst privat an Harness arbeite, würde mich interessieren, mit welchen Tests sich die Wirkung der eingesetzten Open-Source-Projekte in den Ergebnissen zeigt. Gibt es dafür überhaupt ein quantifizierbares und offizielles Benchmark-Tool? Mich würde auch interessieren, wie andere die Wirksamkeit normalerweise überprüfen, wenn es nicht nur um ein subjektives Gefühl geht.