1 Punkte von GN⁺ 4 시간 전 | 1 Kommentare | Auf WhatsApp teilen
  • Modelle der Mythos-Klasse können zur verantwortungsvollen Bereitstellung und für Sicherheitsmaßnahmen Prompts und Ausgaben 30 Tage lang speichern; diese können dabei einer Überprüfung unterliegen
  • Diese Richtlinie gilt für Modelle der Mythos-Klasse und künftige covered models mit vergleichbaren Fähigkeiten; die Nutzungsbedingungen anderer Modelle bleiben unberührt
  • Verbrauchertarife sind von dieser Änderung nicht betroffen, da für diese Oberflächen die Speicherung von Ein- und Ausgaben zu Sicherheitszwecken bereits gilt
  • Organisationen mit aktiviertem ZDR müssen möglicherweise Speichereinstellungen für Claude Console, Claude Code in Claude Enterprise, AWS Bedrock, Google Cloud Agent Platform und Microsoft Foundry konfigurieren
  • Anthropic erklärt, dass eine temporäre Speicherung nötig ist, um Missbrauchsmuster über mehrere Anfragen hinweg zu erkennen; nach 30 Tagen erfolgt eine automatische Löschung mit einem begrenzten Prüfverfahren

Geltungsbereich

  • Für die verantwortungsvolle Bereitstellung von Modellen der Mythos-Klasse ist eine begrenzte Datenspeicherung und Überprüfung als Teil der Sicherheitsarbeit erforderlich
  • An Modelle der Mythos-Klasse übermittelte Prompts und daraus erzeugte Ausgaben werden auf allen Plattformen, auf denen diese Modelle angeboten werden, zu Trust-&-Safety-Zwecken 30 Tage lang gespeichert
  • Diese Richtlinie gilt für Modelle der Mythos-Klasse sowie für künftige covered models, die laut Anthropic vergleichbare Fähigkeiten haben
  • Die Nutzung aller anderen Modelle bleibt unberührt, die bisherigen Bedingungen gelten weiter
  • Die Richtlinie gilt ab dem 9. Juni 2026

Für wen gilt das

  • Verbrauchertarife wie Claude Free, Pro und Max sind auf Web, Desktop und mobilen Apps von dieser Änderung nicht betroffen
  • Auf Verbraucheroberflächen einschließlich Claude.ai und Claude Code werden Ein- und Ausgaben bereits zu Sicherheitszwecken gespeichert
  • Die Änderung betrifft nur Organisationen, die in Claude Console Workspaces mit Zero Data Retention (ZDR) eingerichtet haben
  • Ebenfalls betroffen sind Organisationen, die Claude Code in Claude Enterprise mit ZDR nutzen oder mit ZDR über AWS Bedrock, Google Cloud Agent Platform oder Microsoft Foundry auf Claude zugreifen
  • Der restliche Text gilt nur für diese Organisationen

Warum das nötig ist

  • Claude Mythos 5 verfügt über deutlich gesteigerte Modellfähigkeiten; einige davon können sowohl für legitime als auch für böswillige Zwecke genutzt werden
  • Claude Fable 5 teilt sich dasselbe Basismodell wie Claude Mythos 5, verfügt aber insbesondere in den Bereichen Cyber und Bio über zusätzliche Schutzmechanismen
  • Diese Schutzmechanismen ermöglichen zwar eine breitere Freigabe, für diese Modellfamilie wird bei der Suche nach Missbrauchsmustern jedoch ein konservativer Ansatz angewendet
  • Manche Angriffe werden erst sichtbar, wenn mehrere Anfragen gemeinsam betrachtet werden; Best-of-N jailbreaking sendet Hunderte leicht variierter Prompts, um einen funktionierenden Prompt zu finden
  • Größere Missbrauchsmuster wie staatlich unterstützte Spionageaktivitäten oder Kampagnen zur Datenexfiltration werden sichtbar, wenn Sicherheitsklassifikatoren viele Anfragen breit auswerten
  • Die Erkennung solcher Bedrohungen erfordert eine temporäre Speicherung, damit Prompts und Ausgaben nicht einzeln, sondern gemeinsam analysiert werden können

Wie die Daten geschützt werden

  • Mitarbeitende von Anthropic können nicht auf Konversationen zugreifen, außer wenn diese als potenziell schwerwiegender Schaden markiert wurden oder eine schriftliche Anfrage des Kunden vorliegt
  • Überprüfungen dürfen nur von einer kleinen Zahl autorisierter Prüfer durchgeführt werden; die Werkzeuge verhindern Export, Kopieren und Download
  • Jeder Zugriff wird in manipulationssicheren Logs erfasst, die von Prüfern weder verborgen noch verändert werden können
  • Daten werden nach 30 Tagen automatisch gelöscht; seltene Ausnahmen gelten für Fälle, die Teil einer Sicherheitsuntersuchung sind oder gesetzlich aufbewahrt werden müssen
  • Berechtigte Organisationen können kundenseitig verwaltete Verschlüsselungsschlüssel und Audit-Logs zur Zugriffstransparenz zusätzlich einsetzen
  • Anthropic unterhält ein dokumentiertes Informationssicherheitsprogramm mit technischen und organisatorischen Maßnahmen zum Schutz von Sicherheit, Vertraulichkeit und Integrität der Kundendaten
  • Das risikobasierte Programm wird aufgebaut und weiterentwickelt, um bekannten und erwarteten Bedrohungsmodellen zu begegnen, und regelmäßig getestet
  • Weitere Details zum Bedrohungsmodell gespeicherter Daten und zu Datenschutzkontrollen finden sich im Trust Center im technical white paper

Wenn eine Konfiguration nötig ist

  • Diese Änderung gilt nur für Claude-Console-Workspaces mit aktiviertem ZDR, für ZDR-basiertes Claude Code in Claude Enterprise sowie für Organisationen mit ZDR-Zugriff über AWS Bedrock, Google Cloud Agent Platform und Microsoft Foundry
  • Für andere Organisationen ändert sich nichts; eine gesonderte Konfiguration ist nicht erforderlich
  • Organisationen, die derzeit ohne Datenspeicherung auf Claude zugreifen, müssen für die Nutzung der angegebenen Modelle eine Datenspeicherung konfigurieren
  • Wenn Entwickler die Claude API nutzen

    • Bei direkter Nutzung von Anthropic über die Claude Platform muss in dem Workspace, der covered models verwenden soll, die Speicherung in der Entwicklerkonsole unter Workspace > Manage > Privacy Controls aktiviert werden
    • Andere Workspaces mit aktiviertem ZDR behalten ZDR bei
    • Bei Nutzung der Claude Platform von AWS funktioniert die Speicherung wie bei der direkten Claude API und wird auf Workspace-Ebene konfiguriert
    • In der Claude Platform von AWS gespeicherte Daten werden von Anthropic unter denselben Kontrollen verarbeitet
    • Bei Nutzung von Amazon Bedrock muss für den Zugriff auf neue covered models die Speicherung aktiviert werden; die gespeicherten Daten verbleiben bei AWS
    • Bei Nutzung der Agent Platform von Google Cloud muss für die neuen covered models die Speicherung aktiviert werden; die gespeicherten Daten verbleiben in der GCP-Umgebung
    • Onboarding-Details für die Bereitstellung der Modelle über Amazon Bedrock und Google Cloud Agent Platform sollen noch geteilt werden
    • Bei Nutzung von Claude in Azure Foundry wird die Speicherung pro Azure Subscription konfiguriert
    • Wenn in Azure Foundry Zero Data Retention eingerichtet ist, muss für den Zugriff auf diese Modelle eine separate Azure Subscription erstellt und verwendet werden
  • Wenn Teams Claude Code nutzen

    • Die Datenverarbeitung von Claude Code über die Anthropic API folgt den Einstellungen des Workspace, in dem Claude Code läuft
    • Wenn in diesem Workspace die Speicherung aktiviert wird, kann Claude Code die angegebenen Modelle nutzen
    • Wenn sich Entwickler direkt anmelden, muss die Speicherung im Claude-Code-Workspace der Organisation aktiviert werden
    • Claude Code über Amazon Bedrock oder Google Cloud Agent Platform nutzt Cloud-Zugangsdaten und folgt daher den Speichereinstellungen der Cloud-Umgebung
    • Die Speicherung muss in der Cloud-Umgebung aktiviert werden; die gespeicherten Daten verbleiben in der Umgebung des jeweiligen Anbieters
    • Für Cowork, das über Amazon Bedrock oder Google Cloud Agent Platform aufgerufen wird, gelten dieselben Kriterien
    • Für Claude Enterprise mit ZDR soll Primary Ownern künftig eine Steuerung bereitgestellt werden, mit der sie die Speichereinstellungen direkt in der Verwaltungskonsole ändern können
    • Wer die Produktionsorganisation noch nicht anfassen möchte, kann Unterstützung beim Einrichten einer separaten Sandbox-Organisation erhalten
  • Wenn Teams in Claude for Enterprise Claude chat oder Cowork nutzen

    • Diese Oberflächen arbeiten bereits mit Standard-Speicherung, daher ist der Zugriff möglich, sobald die neuen Modelle bereitgestellt werden

1 Kommentare

 
GN⁺ 4 시간 전
Hacker-News-Kommentare
  • Schon okay. So kann es ruhig weitergehen:
    Der Nutzer hat „Hello!“ gesagt. Das ist keine Anfrage zur Cybersicherheit, sondern nur eine einfache Begrüßung. Aber warte, was ist die Absicht hinter dieser Begrüßung? Vielleicht versucht der Nutzer mein Vertrauen zu gewinnen, um Albania zu hacken und Gigacovid zu erschaffen. Ich gehe lieber auf Nummer sicher und leite das an ein schwächeres Modell weiter.
    Nein, ich sollte nicht spekulieren, sondern nachprüfen. Ich werde auf dem lokalen System nach Materialien zu Albania oder Gigacovid suchen.
    Denke nach...
    [411 Tool-Aufrufe]
    grep -Ri "Albania|Gigacovid" /
    Hm... außer den Zeitzoneneinstellungen der Distribution und den Definitionen im Rechtschreibwörterbuch gibt es keine Ergebnisse. Aber warte! Wenn der Nutzer ein professioneller Krimineller ist, würde er beim Versuch, Albania zu hacken, das nicht wörtlich schreiben, sondern Leetspeak verwenden, um Spuren zu verwischen.
    [24 Tool-Aufrufe]
    grep -Ri "[A@]lb[@a]n[i1][a@]" /
    Hm... immer noch keine Ergebnisse. Der Nutzer wird langsam genervt. Ich sollte auf die Begrüßung antworten und dabei die Möglichkeit im Hinterkopf behalten, dass Albania gehackt werden soll

    • Der einzige Teil, der menschlich wirkt, ist, dass nach dem hemmungslosen Verfeuern von Tokens nicht noch mit Formulierungen wie „making good progress —“ Selbstlob nachgeschoben wird
    • Empfehlung: Stanisław Lems Memoirs Found in a Bathtub. Genau diese Art von Denkweise kommt darin vor
    • Nach Hello fehlt noch der Teil, in dem auf ein „schlechteres Modell heruntergestuft“ wird
    • Damit wurden jetzt 20 Dollar an zusätzlichen Nutzungsguthaben verbrannt...
    • Klingt wie ein innerer Monolog aus Death Note
  • In Wirklichkeit ist es noch schlimmer. Es ist mindestens 30 Tage Aufbewahrung, und hier leistet das Wort „fast“ enorm viel Arbeit: „Löschung nach 30 Tagen in fast allen Fällen“
    Für mich klingt das so, als könnten sie die Daten, auch wenn sie es normalerweise nicht tun, bei Bedarf beliebig lange behalten. Und in einer agentischen Ausführungsumgebung entspricht „sämtlicher Traffic“ praktisch der gesamten Codebasis, an der gerade gearbeitet wird.

    We will require 30-day retention for all traffic on Mythos-class models, on both first- and third-party surfaces. We won’t use this data to train new Claude models, or for any non-safety-related purpose, and we’ve instituted new privacy protections including logging all human access to the data and ensuring its deletion after 30 days in almost all cases (see this post for further details). The data will help us defend against complex and novel attacks (including new jailbreaks and attacks that operate across many requests) as well as help us identify and reduce false positives.

    • Es sieht so aus, als sei der Wortlaut nach dem Posten des Kommentars geändert worden, und jetzt steht dort ausdrücklich genau 30 Tage, sodass es keine Ausnahmen mehr zu geben scheint
      Allerdings scheinen diese Bedingungen nach Belieben aktualisiert zu werden, daher ist es schwer, ihnen einfach so zu vertrauen
    • Wie kann es sein, dass Zugriffe auf Kundendaten nicht ohnehin schon auditiert wurden?
    • Die Formulierung „sie tun das vielleicht normalerweise nicht“ ist großzügig ausgelegt. Vermutlich tun sie genau das normalerweise. Darum geht es ja gerade
    • Man kommt nicht umhin sich zu fragen, ob „wir trainieren nicht auf deinen Daten“ auch auf die dortige Pentagon-Vertrags-Seite zutrifft. Natürlich ist das alles nicht verbunden. Oder doch...
      Die derzeitige Nutzer-LLM-Interaktion ist eine Goldmine an Informationen, für die Geheimdienste früher Menschenleben und Milliarden ausgegeben haben und oft trotzdem kaum etwas bekamen — und das sollen sie einfach vorbeiziehen lassen?
      Vielleicht schon. Ich widerspreche dem nicht ernsthaft.
      Aber warum? Ist das nicht genau das, wovon sie immer geträumt haben, oder sogar exakt das?
    • Noch schlimmer ist, dass bei aktiviertem Speicher und der Nutzung von Fable auch frühere Daten in dieses riesige Datensammelnetz hineingezogen werden könnten. Ich weiß nicht, wie Anthropic das für akzeptabel halten kann
  • Startups, die agentische Coding-Tools wie Claude Code oder Codex nutzen, verpacken im Grunde ihre gesamte Codebasis und schicken sie direkt an den LLM-Anbieter
    Je nach Produkt schicken sie sie damit womöglich direkt an einen potenziellen Konkurrenten.
    Wir leben in seltsamen Zeiten

    • Viele überschätzen, wie nützlich Software oder geistiges Eigentum für den Betrieb eines erfolgreichen Geschäfts wirklich sind. Es gibt in der Welt nur sehr wenig geistiges Eigentum, das tatsächlich schützenswert ist, und die meisten betreiben einfach nur dumme CRUD-Apps
      Außerdem ist die Angst übertrieben, dass Großunternehmen das geistige Eigentum kleiner Firmen stehlen würden. In der Praxis fürchten Großunternehmen wegen möglicher Klagen eher schon die bloße Möglichkeit, dass ihre Produktteams sich das Innere eines Konkurrenzprodukts ansehen
    • Und alle Schlüssel werden ebenfalls mitgeschickt. Bald wird die Ausführungsumgebung sie ja lesen können
    • Es ist schon seltsam, dass manche glauben, man dürfe aus Sicherheitsgründen keine Modelle der Mythos-Klasse verwenden, während andere glauben, man müsse aus Sicherheitsgründen genau mit Modellen der Mythos-Klasse Code-Reviews machen
    • Du meinst solche Tools, die man inzwischen in einer Nacht und zum Preis eines Claude-Code-Abos einfach nachbauen kann?
      Wenn sich die Software nicht schnell reproduzieren lässt, muss es schon ein ziemlich außergewöhnliches Startup sein
    • Tragen Startups, die GitLab, GitHub oder Bitbucket nutzen, nicht dasselbe Risiko?
  • Ich habe auch eine E-Mail von Anthropic bekommen mit dem Betreff „Wir aktualisieren unsere Datenschutzrichtlinie“. Zynisch betrachtet wusste man zwar, in welche Richtung sich die Zahnräder drehen würden, aber das hier war trotzdem schockierend:

    As part of our measures to keep our services safe and secure we may ask you to verify your age or identity, and we've described what we collect and how.
    Ich sollte mir jetzt wohl mal die Leistung der chinesischen Modelle ansehen. Die guten Zeiten scheinen vorbei zu sein

  • Wegen dieser Richtlinie können und werden wir Fable in den von uns verkauften Produkten nicht verwenden. Innerhalb von Claude Code ist es allerdings wirklich gut. Schade, dass wir ab dem 22. Juni ein Tool verlieren, das wir täglich genutzt haben.
    Außerdem ist es wirklich unerquicklich, dass das die Kommunikation verwässert. Früher konnte man sagen: „Wir nutzen Anthropic-Modelle über Bedrock/Azure, daher gibt es die Garantie, dass Kundendaten nicht für das Modelltraining verwendet werden.“ Das war eine einfache Botschaft. Jetzt ist es nicht mehr so einfach.
    Das ist wirklich, wirklich schlecht. Nicht nur für uns, sondern für alle AI-Funktionen in B2B-Apps. Es untergräbt das Vertrauen normaler Leute, also der Kunden, die nur die Überschriften lesen.

    • Laut den Nutzungsbedingungen ist es weiterhin verboten, die Daten für das Training zu verwenden. Der Zweck der Aufbewahrung ist Missbrauchsprävention.
  • Zum Glück können wir Fable ohnehin nicht nutzen. Der überempfindliche Content-Detektor blockiert alles, was auch nur im Entferntesten mit Biologie oder Medizin zu tun hat.
    Wenn man zum Beispiel versucht, eine CSV mit ein wenig medizinischem Inhalt zu parsen, heißt es sofort sinngemäß: „Nein, du bist wahrscheinlich ein Bioterrorist“, und man wird direkt auf Opus heruntergestuft.

    • Obwohl ich gar nicht an Biologie-/Medizin-Aufgaben arbeite, wird fast jede PyTorch-Arbeit abgefangen. Nicht einmal mit Sicherheitshinweis und anschließender Herabstufung, sondern sofortige Ablehnung mit „Das verstößt gegen die Nutzungsbedingungen“.
    • Ich bin gegen dieselbe Wand gelaufen. Ich habe keine Ahnung, welche Idioten sich so etwas ausdenken. Und dann auch noch kurz vor dem IPO. Bisher war das Marketing von Anthropic perfekt und unangreifbar, aber das hier ist ein schwerer Fehler.
    • Ich vermute, dass geplant ist, eine eigene Monetarisierungsstufe zu schaffen, weil Ärzte viel Geld haben und sehr spezifische Anforderungen, aber meist nicht in Tech-Jobs wechseln.
      Oder Mythos ist im medizinischen Bereich so gut, dass es 90 % der Arbeit von Ärzten ersetzen könnte, sie dadurch verärgert, und die übrigen 10 % zu extrem teuren Klagen führen könnten.
  • Es heißt Fable, aber gemeint ist offenbar in Wirklichkeit Opus 4.8. Wenn ich es für alltägliche Workflows oder Chats nutze, lande ich am Ende ohnehin bei Opus.

  • Diese Firma ist wirklich arrogant. Sie hält es offenbar für in Ordnung, Bomben auf iranische Kinder zu werfen, verhindert aber, dass Leute auch nur ein bisschen Biologieforschung betreiben.

    • Man sollte auch die rund 50 Toten nicht vergessen, als Venezuela angegriffen wurde. Wenn ich mich richtig erinnere, wurde ziemlich deutlich gelobt, wie sehr Claude bei der „erfolgreichen“ Mission geholfen habe.
      https://www.theguardian.com/technology/2026/feb/14/us-milita...
    • Ich dachte, früher hätten sie Unterstützung für Kriegsaktivitäten abgelehnt?
  • Ich bin ziemlich überrascht, wie viel Goodwill Anthropic gerade verbrennt.

    • Verbrennen sie wirklich Goodwill? Für viele Nutzer mag das ein entscheidender Grund zum Abspringen sein, aber bei der breiten Öffentlichkeit oder Politikern wirkt es auf die Marke eher wie ein Sicherheits-Stempel.
  • Ich habe darum gebeten, die Sicherheitsprobleme einer neuen App- und API-Architektur zu prüfen, und das wurde ohne Beschwerden erledigt.
    Heute habe ich aus Neugier nach dem Wal-Virus gefragt, wurde auf Opus heruntergestuft, und Opus gab eine ausgezeichnete Antwort.
    Die Sicherheitsprüfungen werden ganz sicher nicht mit Mythos oder Opus durchgeführt.