15 Punkte von GN⁺ 2026-01-25 | 1 Kommentare | Auf WhatsApp teilen
  • Swarms ist eine in Claude Code vorhandene, aber bisher nicht veröffentlichte Funktion zur Orchestrierung mehrerer Agenten
  • Nutzer sprechen nicht mehr mit einem einzelnen AI-Coder, sondern interagieren mit einer AI in der Rolle eines Teamleiters
  • Der Teamleiter schreibt den Code nicht selbst, sondern plant, verteilt Aufgaben und fasst Ergebnisse zusammen und weist Unteragenten Rollen zu
  • Nach Freigabe des Plans werden spezialisierte Worker-Agenten parallel ausgeführt und übernehmen die eigentliche Implementierung
  • Das zeigt, wie sich Claude Code über ein einzelnes Tool hinaus zu einem Entwicklungsprozess auf Teamebene erweitert

Funktionsweise

  • Sobald der Nutzer den Plan freigibt, wird in den Delegation Mode gewechselt
  • Mehrere spezialisierte Worker-Agenten werden erzeugt und arbeiten parallel
  • Jeder Worker übernimmt konkrete Implementierungsaufgaben wie Code schreiben, analysieren und ändern
  • Über Nachrichten zwischen den Workern werden Fortschritt und Abhängigkeiten koordiniert
  • Alle Ergebnisse werden beim Teamleiter gesammelt und als finale Antwort zurückgegeben

Tool claude-sneakpeek

  • Das Repo claude-sneakpeek bietet einen Parallel-Build von Claude Code mit geöffneten Feature-Flags
  • Nicht veröffentlichte Funktionen einschließlich des Swarms-Modus lassen sich damit ausprobieren; die Ausführung erfolgt in einer vollständig von der bestehenden Claude-Code-Installation getrennten Umgebung
    • Verwendet eigene Einstellungen, Sessions, MCP-Server und Zugangsdaten
    Anzeige
  • Es werden zusätzliche Funktionen bereitgestellt, die in Claude Code eingebaut, aber noch nicht veröffentlicht sind
    • Unterstützung für native Ausführung mit mehreren Agenten über den Swarm mode
    • Erstellung von Hintergrund-Agenten über den Delegate mode
    • Funktionen für Messaging zwischen Teammitgliedern und Verwaltung der Aufgabenverantwortung
  • Unterstützung für separate Modelle und Anbieter
    • Unterstützung für Z.ai, MiniMax und OpenRouter; lokale Modelle können über cc-mirror angebunden werden

1 Kommentare

 
GN⁺ 2026-01-25
Hacker-News-Kommentare
  • Ehrlich gesagt klingt das vielleicht verrückt, aber ich habe damit schon den qualitativ besten Code bekommen.
    Es hat etwa das Zehnfache gekostet, aber ich ließ ein ganzes „Projektteam“ mit mehreren Sub-Agenten von einer einzigen Opus-Instanz verwalten.
    Die Aufgabe war, einen Legacy-Java-Server auf C# .NET 10 zu portieren, und ich nutzte 9 Agenten, ein 7-stufiges Kanban und eine getrennte Git-Worktree-Struktur.
    Die Rollen waren wie folgt —
    Manager (Claude Opus 4.5): globale Event-Loop, die Agenten je nach Kanban-Status aufweckt
    Product Owner (Claude Opus 4.5): zuständig für die Strategie, verhindert Scope Creep
    Scrum Master (Opus 4.5): priorisiert den Backlog und weist Tickets zu
    Architect (Sonnet 4.5): ausschließlich für das Design zuständig, implementiert nicht
    Archaeologist (Grok-Free): liest nur bei Bedarf dekompilierten Legacy-Java-Code
    CAB (Opus 4.5): Gatekeeper, der Funktionen in Design- und Code-Phase ablehnt
    Dev Pair (Sonnet 4.5 + Haiku 4.5): AD-TDD-Loop, der Junior schreibt fehlschlagende Tests, der Senior behebt sie
    Librarian (Gemini 2.5): Dokumentationsverwaltung und Auslösen von Retrospektiven
    Ehrlich gesagt würde die Antwort auf „Braucht man das wirklich?“ wohl „Nein“ lauten, aber es hat einfach riesigen Spaß gemacht, den AI-Agenten bei der Zusammenarbeit zuzusehen.
    Eine frühe Version des Prozesses gibt es hier als Bild

    • Ich frage mich, ob du technische Details dazu teilen kannst.
      Mich würde interessieren, ob das rein promptbasiert ist, ein Plugin oder eine Struktur mit wiederholten Aufrufen per Skript.
      Und ich frage mich auch, wo das Kanban existiert.
    • Ich nutze ebenfalls eine ähnliche Struktur.
      Sie besteht aus einem Koordinator und ein paar spezialisierten Agenten wie Backend-, Frontend- und DB-Experten.
      Der Schlüssel ist der Koordinator. Er reduziert meine kognitive Last und verfolgt den Gesamtfortschritt gut.
    • Normalerweise weist ein Scrum Master Tickets nicht direkt zu.
    • Ich denke, der nächste Schritt ist, das, was du gebaut hast, als Service anzubieten.
      So nach dem Motto: „Ich will nicht mit dem Affen sprechen, ich will mit dem Orgelspieler sprechen“ — zuerst führt man Interviews mit Manager und Programmmanager, danach kümmern die sich selbst darum, und man fordert nur noch Demos und Updates an. Lustig.
    • Ich frage mich, ob das Satire ist oder ernst gemeint.
  • Tatsächlich nutzt das einfach die in Claude eingebaute Sub-Agent-Funktion.
    Man muss kein tmux-Abstraktionsmonster mit 300.000 Zeilen in Go bauen.
    Man lässt Claude einfach parallel mit Sub-Agenten im Hintergrund arbeiten.
    Es ist sinnvoll, Dateien für Prompt-Übergabe, Fortschrittsverfolgung und Reporting zu haben, und ich empfehle, jeden Agenten auf einen eigenen Worktree zu beschränken.
    Ich dokumentiere dieses Muster gerade auf workforest.space.
    Die meisten bauen einen separaten Orchestrator, aber in Wahrheit ist Claude selbst der beste Orchestrator.

    • Das ist nicht einfach nur ein Sub-Agent.
      Der Unterschied zu bestehenden Tools ist, dass die Abstraktion nicht auf Konversationsebene, sondern auf Aufgabenebene liegt.
      Claude Code war wegen Drittanbieter-App-Problemen bisher auf Konversationen zentriert und daher begrenzt, aber Claude Code Web hat das erstmals erweitert.
      Dieser Ansatz lässt AI Aufgaben selbst koordinieren, ohne dass der Nutzer ständig neue Prompts geben muss.
      Es ist komplex, entwickelt sich aber zu einer Struktur, in der AI andere AI verwaltet.
    • Eigentlich ist das weniger eine neue Funktion, sondern eher die Nutzung der bereits vorhandenen Sub-Agenten von Claude für echte Implementierungen.
      Allerdings fehlt es noch an Planungsdetails, daher ist die Zuverlässigkeit bisher begrenzt.
    • Es unterscheidet sich von bisherigen Sub-Agenten.
      Der Hauptagent wechselt in einen kontextzentrierten Delegationsmodus, integriert mit einem teambasierten Task-System und einem Mailbox-System.
      Das ist ein Grad an Integration, den man mit einem Plugin nicht umsetzen kann.
    • Durch die Visualisierung von „stacked PRs“ habe ich das Konzept sofort verstanden.
      Ich staple Commits wie PRs und räume sie dann per Rebase auf, aber das war ziemlich schmerzhaft.
      Jetzt könnte ich das verbessern, indem ich Branches auf 2–3 aufteile und sie so verwalte, dass Konflikte minimiert werden.
    • Ich nutze ebenfalls eine Hauptinstanz von Claude in der Manager-Rolle, die die Implementierungsagenten verwaltet.
      Das hilft, den Kontext sauber zu halten und trotzdem hochwertige Ergebnisse zu erzielen.
  • Ich möchte, dass sich Code in Richtung kürzer und qualitativ besser entwickelt.
    Aber der aktuelle Trend scheint in die entgegengesetzte Richtung zu gehen.
    Wenn Modelle robuster werden und Common Sense sowie Feedback-Loops stärker werden, kann das nützlich sein, aber im Moment verschärft es eher das Problem nach dem Motto „je mehr Code, desto besser“.
    Beeindruckende Demos sind möglich, aber in realen Produktionsumgebungen wird das wohl zu 10- bis 100-fach komplexerem Code führen.

    • Ich hatte eine ähnliche Erfahrung.
      Als Claude in CI Test-Coverage-Statistiken hinzufügen sollte und nyc nicht installiert war, wollte es Istanbul in bash nachbauen.
      Am Ende musste ich sagen: „Installier einfach nyc.“
    • Dass diese Funktion noch nicht veröffentlicht ist, deutet darauf hin, dass Anthropic wohl ebenfalls denkt, dass das Modell noch nicht weit genug ist.
      Trotzdem dürften solche Experimente helfen, die Grenzen des Modells zu erweitern.
      Vielleicht noch nicht jetzt, aber 2026 könnte es möglich sein.
  • Ich wünschte, es gäbe auf HN regelmäßig eine Umfrage mit Beliebtheitsrankings für AI-Coding-Agenten.
    Ähnlich wie der TIOBE Index nach Programmiersprachen würde ich gern Trends sehen, welche Modelle gerade populär sind.

    • Man kann auch einfach eins auswählen, das einem gefällt.
      Dieser Ranking-Wettbewerb ist am Ende nur ein sich drehender Hype-Zyklus.
    • Ich habe gerade eine ähnliche Umfrage gestartet. Teilnahme willkommen → agentic-coding-survey.pages.dev
    • Das ist zwar keine Community-Meinung, aber ich schaue oft auf das lmarena-Leaderboard.
      Interessant fand ich, dass MiniMax 2.1 über den meisten GPTs liegt.
      Auf openrouter.ai kann man sich auch grob Durchsatz und Kosten des Modells ansehen.
    • Ich verfolge aktuelle Entwicklungen über den Newsletter von Zvi Mowshowitz.
      Deshalb habe ich Opus 4.5 schon eine Woche nach Release als mein Hauptmodell verwendet.
    • Mein Agenten-Skill gehört im skills.sh-Verzeichnis zu den Top 10.
      Etwa 80 % dieser Nutzerschaft verwenden Claude Code, 75 % sind in einer darwin-arm64-Umgebung.
  • Claude erzeugt so viel Code, dass Reviews schwierig werden.
    Manche sagen, „solange die Tests durchlaufen, passt es“, aber bei langfristig wartbaren Projekten fühlt sich das riskant an.
    Mich interessieren Erfahrungen von Leuten, die in langfristigen Produktionsprojekten YOLO-artige Codegenerierung ausprobiert haben.

    • In echten professionellen Umgebungen reicht es völlig, jeweils nur mit einem Agenten gleichzeitig zu arbeiten.
      Die Codequalität ist noch niedrig, und auch beim Debugging liegt er oft daneben.
      Für Suche, Verständnis und Ideenerweiterung ist es trotzdem nützlich.
      Für private Experimentierprojekte kann ein YOLO-Ansatz okay sein.
    • Ich arbeite zwar bei Graphite/Cursor, aber wenn man CC Änderungen als Stack verwalten lässt und einen automatischen Review-Agenten davorsetzt, werden auch große Änderungen leichter verständlich.
      So kann man die Codegenerierung automatisieren und trotzdem das Systemverständnis erhalten.
    • Wenn Claude Code Code schreibt, lasse ich mit meinem „codex-review“-Skill den letzten Commit prüfen.
      Ich lasse Codex Review-Punkte vorschlagen und überprüfe dann in der tatsächlichen Review, wie präzise diese Punkte sind.
    • Es ist noch zu früh, um Ergebnisse klar zu sehen, aber gegen Ende dieses Jahres werden wir wohl erleben, was aus Projekten wird, die wie auf Sand gebaut sind.
  • Da war die Formulierung: „Jetzt spricht man nicht mehr mit einem AI-Coder, sondern mit dem Team Lead“ —
    und komischerweise wirkte sogar dieser Tweet selbst so, als hätte ihn eine AI geschrieben.

    • Stimmt, solche rhetorischen Formulierungen wiederholen sich bei AI viel zu oft.
  • 2026 werden Agenten-Orchestratoren wahrscheinlich ein großer Trend.
    Bestehende Software-Begriffe wie Team Lead oder Teammitglied unverändert zu verwenden, wird Verständnis und Akzeptanz erhöhen.

    • Stimme zu. Komplexe Konzepte wie Gas Town sind nur Workarounds, um abnormales Verhalten von Modellen zu korrigieren.
      Wenn Anthropic seine eigenen Modelle koordinieren kann, werden solche Schichten überflüssig.
      Am Ende geht es um Messaging und Task-Management.
    • Ich denke allerdings, dass Konzepte wie Polecats helfen, übermäßige Vermenschlichung (Anthropomorphisierung) zu vermeiden.
  • Die Aussage „Sag einfach dem Team Lead und dem ganzen Team: Macht diesen Button rot“ fand ich lustig.

    • „Leitender Ingenieur! Wir brauchen Architektur! Marketing-Team, Celebrity-Werbung! Produktteam, Roadmap! ML-Team, Trainingsdaten einarbeiten! Finanzteam, ROI berechnen! Ops-Team, 24/7-Abdeckung!“
      Und am Ende lautete das Fazit: „Gut, jetzt macht den Button rot!“ Perfekte Satire.
    • Selbst wenn Claude das einfach per Prompt erledigen kann, werden wir nicht akzeptieren, dass es damit getan ist.
      Dieses Video vermittelt das Gefühl ganz gut.
    • Der grundlegende System-Prompt ist so gestaltet, dass er gut beurteilt, wann der Swarm-Modus verwendet werden sollte.
      Mit zusätzlichen Anweisungen in CLAUDE.md kann man es so anpassen, dass der Swarm-Modus für triviale Aufgaben nicht verwendet wird.
  • In der aktuellen Version 2.1.9 hat sich die Art, wie die Main-Loop Sub-Agenten orchestriert, komplett verändert.
    Es erscheinen Logs wie „FTSChunkManager agent läuft noch, macht aber Fortschritte, also warten wir“, zusammen mit Stacktraces und JSON-Ausgaben.

  • Ich habe dieses Verhalten direkt in der Claude-Code-Desktop-App gesehen.
    Unter einer Master-Task erkunden zahlreiche Worker-Lead-Agenten die Codebasis und schreiben Reports sowie TODO-Listen.
    Ein anderes System fasst das dann zusammen und erstellt ein Master-Schema und einen Plan.
    Ich erstelle jeweils separate Chats für DevOps, Frontend, Architektur und Security, und wenn jeder Chat endet, hinterlässt er Logs und tauscht Updates mit den anderen aus.
    Wenn man per SSH mit einem Droplet verbindet und das Terminal nutzen lässt, wiederholt Claude eigenständig Build, Fix, Test und Verifikation.
    So habe ich in nur drei Tagen dieses Projekt fertiggestellt.

    • Eigentlich ist das einfach die Grundfunktion, mehrere parallele Erkundungsagenten zu starten und ihre Ergebnisse zusammenzuführen.
    • Das Verhalten ist oh-my-opencode sehr ähnlich.