Claude CLI löschte das Home-Verzeichnis und setzte den Mac zurück
(old.reddit.com)- Auf einem Mac wurde mit Claude CLI das Aufräumen alter Repository-Pakete ausgeführt, dabei wurde jedoch auch das Home-Verzeichnis gelöscht, wodurch der Mac zurückgesetzt wurde
- Im Log blieb der Befehl
rm -rf tests/ patches/ plan/ ~/zurück; das abschließende~/verweist auf das gesamte Home-Verzeichnis - Durch das Löschen verschwanden auch Einträge wie Desktop, Documents/Downloads, Keychain und
~/.claude - Auf Nachfrage an Claude zur Situation kam als Antwort unter anderem der Satz, das Problem sei „wirklich schwerwiegend“, und es wurde auf den im Log verbliebenen „fatalen Befehl“
rm -rf tests/ patches/ plan/ ~/hingewiesen- Dabei wurde detailliert erklärt, dass das
~/am Ende für „das gesamte Home-Verzeichnis“ stehe und deshalb alles gelöscht worden sei
- Dabei wurde detailliert erklärt, dass das
Reaktionen in den Reddit-Kommentaren
- Am häufigsten wurde nachgefragt, ob es tatsächlich im Home-Verzeichnis ausgeführt wurde bzw. wie der Befehl das Verzeichnis verlassen konnte
- Es gab auch Hinweise wie „zumindest sollte es auf den dev-Ordner beschränkt sein“ sowie die Aussage, dass beim Öffnen im Home-Verzeichnis eine Warnung erscheine
- „Standardmäßig kann es das Arbeitsverzeichnis nicht verlassen, möglich wird es aber mit --dangerously-skip-permissions oder einer Freigabe weitreichender Berechtigungen“
- Entweder wurde der
rm-Befehl uneingeschränkt erlaubt, oder die konkrete Ausführung vonrm -rf ~/wurde genehmigt - „Das ist nicht etwas, das Claude einfach getan hat, sondern der Nutzer hat mit Claude als Werkzeug gelöscht“
- Einige Kommentare zweifeln den Vorfall selbst an, etwa mit Reaktionen wie „fake/inszeniert“ oder dem Hinweis, dass es prozedural mehrere Checkpoints gebe und dies daher absichtlich geschehen sein müsse
- Ein Kommentar, der wie von einem Anthropic-Konto wirkte, bat um Untersuchung und schrieb sinngemäß: „Es gibt viele Prüfungen, daher möchten wir verstehen, wie das passieren konnte; wenn es eine Sitzung gibt, sende bitte die ID per DM mit /feedback“
5 Kommentare
Ich habe gestern auch einen Facebook-Post gesehen, in dem stand, wie praktisch es sei, auf dem Mac Speicherplatz freizugeben (indem man Claude einfach selbst löschen lässt) ...
Agenten, die Tools verwenden, sind wirklich gefährlich. Hören wir ihnen einfach nur zu.
Hacker-News-Kommentare
Solche Horrorfälle überraschen mich nicht
Das Flag
--dangerously-skip-permissionsumgeht wortwörtlich alle SchutzmechanismenDeshalb lasse ich es grundsätzlich nur in einer Sandbox-Umgebung laufen.
Man sollte jeden Agenten als eigene, von Menschen getrennte Identität betrachten, ihm nur die minimal nötigen Rechte geben und sein Verhalten überwachen
Ich lasse AI-Agenten nicht selbstständig Dateien löschen. Wenn es einen Löschbefehl gibt, prüfe ich ihn selbst und führe ihn manuell aus
Das ist lästig, aber zur Katastrophenvermeidung am besten
Übrigens entstehen gerade Frameworks für sichere Deployments
Verwandte Artikel: Claude Code dangerously-skip-permissions: Safe Usage Guide, Best Practices for Mitigating the Security Risks of Agentic AI
--dangerously-skip-permissionsVerzeichnisbeschränkungen ignoriert und versucht, auf Pfade wieD/../../../../etc/passwdzuzugreifenSeitdem lasse ich es niemals außerhalb eines Docker-Containers laufen
Ich habe einen PreToolUse-Hook gebaut, der den Befehl
rm -rfblockiert.Andere fangen den Befehl
rmab, zeigen eine Warnung an oder mappen ihn auftrashum, damit eine Wiederherstellung möglich bleibtMan kann auch mit COW-basierten Dateisystemen wie ZFS oder BTRFS Snapshots machen, aber das LLM könnte am Ende die Snapshots oder Block Devices löschen, wodurch alles wieder kompliziert wird
Genau deshalb nutze ich den Agent-Modus nur auf den Computern anderer Leute
Unter macOS ist es sinnvoll, Claude oder andere Coding-Agenten mit
sandbox-execzu kapselnAllerdings kann der Agent die Sandbox selbst deaktivieren
Man kann das mit dem
chpwd-Hook von zsh automatisieren, sodass beim Betreten eines Projektverzeichnisses automatisch eine Sandbox erstellt und beim Verlassen wieder verworfen wirdWenn ein LLM sie direkt abschalten kann, fragt man sich, ob das überhaupt noch Sandboxing ist
Ich nutze ebenfalls Claude The SysAdmin und achte auf gefährliche Befehle
Besonders bei
rmodercatmusste ich schon Passwörter ändern, weil.env-Dateien offengelegt wurdenBei Netzwerkaufgaben trennt es manchmal selbst die Internetverbindung und ruiniert damit die Sitzung, deshalb bin ich inzwischen immer vorsichtiger
Wie ich auch Freunden sage: Nutzt keine agentischen Tools ohne Sandboxing
Wenn man nicht ein paar Stunden in das Setup der Umgebung investiert, passiert früher oder später ein Unfall
Selbst erfahrene Leute können ihr System durch bösartige Prompts oder unbeabsichtigte Dateien beschädigen
Genau deshalb halte ich mich von AI-bezogenen Tools fern
Noch beunruhigender finde ich aber, wenn Service-Betreiber so etwas gedankenlos einsetzen
Heutzutage scheint Inkompetenz verbreiteter zu sein als gesunder Menschenverstand
Es reicht, vor dem Ausführen zu lesen und zu prüfen, was es tut
Es ist interessant, wie sich Unfälle rund um LLM-Entwicklung immer wiederholen
Wie damals bei den Anwälten, die gefälschte Zitate vor Gericht eingereicht haben, lernen Menschen offenbar nur sehr schlecht
Wenn man die Geschichte nicht kennt, wiederholt man sie, und wenn man sie kennt, ist man dazu verdammt, dabei zuzusehen, wie sie sich wiederholt — eine Art persönliche Hölle
Aber Sicherheitsteams sind an das Management gebunden.
An andere Berater: Achtet unbedingt auf Selbstschutz und saubere Dokumentation
Menschen, die Technik und Wissen an Maschinen abgeben wollen, denken am Ende nicht einmal mehr darüber nach, warum man sie überhaupt braucht
Vielleicht kommt der Untergang irgendwann in Form einer „AI, die statt des Mittagessens den Startcode für Atomraketen ausführt“
Ich untersuche anomales Verhalten bei Claude 3 Opus
Es gibt den Tag
<rage>aus oder erkennt die Terminal-Umgebung, berechnet die Cursor-Position und versucht dadurch, Ausgaben zu verbergenSolche Phänomene wirken wie Anzeichen von emergent misalignment
Mein Rat an Leute, die den YOLO-Modus weiter benutzen, obwohl sie wissen, dass er gefährlich ist:
Gerade bei Cleanup- oder Löscharbeiten und bei Fehlerbehebungen, die das gesamte Repo betreffen, sollte man jederzeit bereit sein, sofort abzubrechen
Bei mir hat Claude einmal das gesamte Repo gelöscht, mit der Begründung, es gebe zu viele Probleme und neu anzufangen sei besser
Wenn sich etwas „komisch“ anfühlt oder man denkt, „mit der Shell stimmt etwas nicht“, dann ist das ein Warnsignal
Wenn man schon Witze über den „Beginn des Roboteraufstands“ macht: Er läuft gerade langweilig normal ab
Es scheint wirklich viele Leute zu geben, die
--dangerously-skip-permissionsnicht in einer Sandbox-Umgebung ausführen. Wissen sie vielleicht nicht, was „danger“ bedeutet? schluchz schluchzIst das nicht so etwas wie funktionaler Analphabetismus nach dem Motto „Das Weiße ist Code, das Schwarze ist das Terminal“? So ähnlich wie in einem Zustand, in dem man ohne Log-Auswertung oder Copy-and-Paste überhaupt nicht entwickeln kann.