Claws ist jetzt eine neue Schicht oberhalb von LLM-Agenten
(twitter.com/karpathy)- Nachdem Agenten auf LLMs aufgesetzt wurden, ist darüber die Claws-Schicht entstanden, die Orchestrierung, Scheduling, Kontextverwaltung, Tool-Aufrufe und Persistenz übernimmt
- Sie abstrahiert die Ausführungsstruktur von Agenten um eine weitere Ebene und ermöglicht so Automatisierung auf höherem Niveau und bessere Konfigurierbarkeit
- OpenClaw umfasst rund 400.000 Zeilen Code, zugleich gibt es Bedenken gegenüber einer Struktur, der persönliche Daten und Schlüssel anvertraut werden
- Es wurden exponierte Instanzen, RCE-Schwachstellen, Supply-Chain-Kompromittierungen sowie bösartige oder beschädigte Skills in Registries und viele weitere Sicherheitsrisiken beobachtet
- Das aktuelle Ökosystem wirkt wie ein „Wilder Westen“ und kommt einem Sicherheitsalbtraum nahe
- NanoClaw hat mit rund 4.000 Zeilen im Core-Engine eine vergleichsweise kleine Struktur
- Die Codebasis ist klein genug, um sie gedanklich zu überblicken, was Vorteile bei Verwaltung, Auditierbarkeit und Flexibilität bringt
- Standardmäßig werden alle Ausführungen in einer Container-Umgebung durchgeführt
- Statt Konfigurationsdateien wird ein skills-basiertes Konfigurationsmodell verwendet
- Der Befehl
/add-telegramweist den Agenten an, wie der eigentliche Code geändert werden soll - Ein neuer AI-basierter Ansatz, der komplexe Konfigurationsdateien und verzweigte Bedingungsstrukturen reduziert
- Der Befehl
- Die Meta-Strategie ist stark: ein Repository so zu gestalten, dass es sich möglichst leicht forken lässt, und es dann über Skills in verschiedenste Konfigurationen zu transformieren
- Es sind bereits mehrere Variantenprojekte wie nanobot, zeroclaw, ironclaw und picoclaw entstanden
- Es gibt auch Alternativen für Cloud-Hosting, aber eine lokale Umgebung ist für Experimente und Erweiterungen besser geeignet
- Auch die Anbindung an Home-Automation-Geräte auf Basis des lokalen Netzwerks ist einfacher
- Konzeptionell ist die Idee eines persönlichen digitalen Agenten, der auf einem physischen Gerät läuft, besonders reizvoll
- Claws etabliert sich als neue Schicht des AI-Stacks und definiert die Struktur der nächsten Phase nach Agenten
- Meine konkrete endgültige Konfiguration steht noch nicht fest, aber als experimentelle und erweiterbare Struktur weckt sie große Erwartungen
2 Kommentare
NanoClaw – ein TypeScript-basierter Claude-Assistent mit 500 Zeilen, der in Apples Container-Isolationsumgebung läuft
Zum Zeitpunkt der Veröffentlichung waren es 500 Zeilen, inzwischen scheinen es eher 4000 zu sein ??
Hacker-News-Kommentare
Mehrere Kommentare mit persönlichen Angriffen wurden entdeckt und gelöscht
Auf HN sind persönliche Angriffe auch bei Meinungsverschiedenheiten absolut verboten. Sie untergraben den Zweck der Seite.
Wer die Richtlinien zuletzt nicht gelesen hat, sollte sie unbedingt noch einmal durchgehen.
Aus Sicherheitssicht ist ein Claw ähnlich wie ein menschlicher Assistent oder Berater
So wie man keinen Zugriff auf private E-Mails oder Bankkonten gibt, sollte man ein separates E-Mail-Konto und eine eingeschränkte Firmenkreditkarte einrichten.
Auch wenn man ihnen kein Bankkonto gibt, erhalten Buchhalter oder Finanzberater manchmal Zugriff.
Als ich ein CLI-basiertes Agenten-Tool gebaut habe, habe ich eine Schutzmaßnahme eingebaut
Für riskante Aktionen, etwa das massenhafte Versenden von E-Mails, ist ein Einmalpasswort (OTP) erforderlich.
Das Tool weist den Agenten an, den Nutzer nach dem OTP zu fragen, und ohne Eingabe geht es nicht weiter.
Ich habe Claw noch nicht benutzt, aber ich halte so eine Struktur mit menschlichem Eingreifen für unverzichtbar.
Deshalb baue ich alle CLI-Tools für Agenten selbst, um mehr Kontrolle zu haben.
Wenn es Claw schon früher gegeben hätte, wäre das Internet vielleicht anders geworden
Eine einfache menüartige Struktur auf Basis des Gopher-Protokolls hätte für LLMs womöglich besser gepasst.
Wenn künftig mehr Interaktionen von nutzerseitigen Agenten ausgehen, könnte sich das in diese Richtung entwickeln.
Wenn YouTube, Gmail, HN, Banken und Stromversorger alle APIs wären, könnten Nutzer die Oberfläche so zusammensetzen, wie sie wollen.
Unternehmen würden das ablehnen, weil ihre Monopole aufbrechen, aber die Technik wäre weniger profitabel und zugleich wertvoller.
foo-wwwundfoo-httpexperimentiert.Als der CGI-Vorschlag kam, dachte ich: „Das wird niemand benutzen“ — am Ende hat dann doch jeder diese Spezifikation implementiert. Schade, dass diese frühe Flexibilität verloren ging.
Ich spreche über Telegram mit meiner OpenClaw-Instanz auf dem Mac. De facto nutze ich also schon eine neue Schnittstelle statt einer App-UI.
Es wäre sinnvoller, statt Fenstern für Menschen agentenzentrierte Interfaces zu bauen und nur noch eine Oberfläche zur Verifikation übrig zu lassen.
Der eigentliche Kern von Claw ist, dass es sich um einen nutzerzentrierten Agenten handelt
Die Art von AI, die Menschen nicht mögen, ist die von Unternehmen kontrollierte AI. Claw gehört dem Nutzer und bekommt sogar einen Namen.
Das ist der Unterschied zwischen einem Gefährten wie R2D2 und einem Roboter-Klon, der mir etwas verkaufen will.
Ich habe mich gefragt, was „Claw“ eigentlich genau ist.
Ist das eine AI mit Zugriff auf persönliche Daten wie E-Mail?
Ist es sicher, wenn man sie mit einem lokalen LLM in einem Container laufen lässt?
Es kann auf Consumer-Hardware oder auf einem VPS laufen. Da entsteht gerade ein neuer Markt.
Es arbeitet asynchron mit meinen Zugangsdaten. Simpel, aber interessant.
Meine Zusammenfassung: OpenClaw hat ein Sicherheitsrisiko von 5/5
Selbst ein vollständig geprüftes NanoClaw läge bei etwa 4/5.
Mit menschlichem Eingreifen wird es besser, aber der Nutzen sinkt rapide.
LLMs sind gut zum Erzeugen von Guardrails auf Basis von Sprachspezifikationen oder Tests, aber mir ist Stabilität wichtiger.
Die Bezeichnung „Claw“ wird sich wohl als Sammelbegriff für persönliche AI-Agenten vom Typ OpenClaw festsetzen
Der aktuelle Hype um Agenten-Workflows ignoriert das grundlegende Problem des fehlenden Sicherheitsperimeters
Wenn ein LLM unbegrenzten Shell-Zugriff hat und dabei nicht vertrauenswürdige Daten einliest, ist indirekte Prompt-Injection unvermeidlich.
Außerdem verschlechtern riesige System-Prompts und Tool-Schemata, die in den Kontext hineingestopft werden, die grundlegenden Reasoning-Fähigkeiten des Modells und vergrößern die Angriffsfläche.
Noch vor GTA VI kam bereits die Store-Marke Claw heraus
Als ich es selbst gebaut habe, reichten 50 Zeilen Code völlig aus.
Ein paar Zeilen Telegram-Bibliothek und
claude -p prooomptgenügen.Als Referenz kann man sich den ULTRON-Beispielcode ansehen.
Natürlich delegiert der Agent nach außen, aber selbst mit 50 Zeilen Bash kann man fast perfekte Ergebnisse erzielen.