3 Punkte von GN⁺ 3 시간 전 | 1 Kommentare | Auf WhatsApp teilen
  • Die Trump-Regierung hat beschlossen, jede Nutzung der Top-AI-Modelle von Anthropic im Ausland zu blockieren; Auslöser waren Gespräche zwischen dem Amazon-CEO und US-Beamten, darunter dem Finanzminister
  • Amazon-Forscher erhielten mit einer Reihe von Prompts aus dem Modell Fable 5 gesperrte Informationen, die für Cyberangriffe nutzbar sein könnten, und meldeten dies den Behörden
  • Nach einer Reaktionssitzung entschied das Weiße Haus, den Modellzugang für ausländische Regierungen, Unternehmen und Privatpersonen zu sperren, als direkteste Lösung; Präsident Trump genehmigte dies aus Sicherheitsgründen
  • Anthropic sperrte zur Einhaltung der Vorgaben den vollständigen Nutzerzugang zu Mythos und Fable; viele Forscher mit ausländischer Herkunft sind damit faktisch von der Arbeit an den neuesten Modellen ausgeschlossen
  • Neben Sicherheitsbedenken könnten auch Misstrauen und politische Spannungen der Regierung gegenüber Anthropic die Entscheidung beeinflusst haben; dies wird als Teil eines Trends zu stärkerer staatlicher Kontrolle über die AI-Industrie gewertet

Wie das Vorgehen ausgelöst wurde

  • Gespräche von Amazon-CEO Andy Jassy mit US-Beamten, darunter Finanzminister Scott Bessent, lösten in der Trump-Regierung die Entscheidung zur Sperrung der Auslandsnutzung aus
    • Jassy teilte den Behörden mit, dass Amazon-Forscher aus Fable 5 Informationen zur Unterstützung von Cyberangriffen erhalten hätten, die eigentlich blockiert werden sollten
    • Führungskräfte der Tech-Branche stehen regelmäßig mit der Regierung in Kontakt, um über die Schlagkraft fortschrittlicher AI-Tools zu sprechen
  • Kurz darauf hielten Beamte des Weißen Hauses ein Treffen zur Diskussion von Gegenmaßnahmen ab, und Sicherheitsforscher begannen, Amazons Behauptungen zu prüfen
    • Die Sperrung des Tool-Zugangs für ausländische Regierungen, Unternehmen und Privatpersonen wurde als direkteste Maßnahme zur Risikoreduzierung festgelegt
    • Präsident Trump genehmigte die Maßnahme aus Sicherheitsgründen trotz Bedenken, Innovationen zu bremsen

Reaktion und Auswirkungen bei Anthropic

  • Anthropic sperrte zur Einhaltung der Vorgaben den gesamten Nutzerzugang zu Mythos und Fable
    • Dadurch könnten Bemühungen von Unternehmen weltweit behindert werden, diese Tools zur Identifizierung von Software-Schwachstellen zu nutzen
    • Da viele Anthropic-Forscher aus dem Ausland stammen, macht die Regelung die Arbeit an den neuesten Modellen faktisch unmöglich
  • Anthropic erklärte, die von Amazon benannte Schwachstelle sei vergleichsweise grundlegend, auch in anderen öffentlichen Modellen auffindbar und stelle keinen vollständigen Jailbreak dar
    • Einige Sicherheitsforscher stimmen dieser Einschätzung zu
    • Das Unternehmen erklärte, es verfüge über angemessene Sicherheitsvorkehrungen und stelle Sicherheit in den Vordergrund; bereits zuvor war eine Ausweitung des Zugangs zu Mythos auf Anweisung des Weißen Hauses verschoben worden

Verhältnis zwischen Amazon und Anthropic

  • Amazon ist ein großer Investor von Anthropic, liefert Chips für Rechenzentren und nutzt die Top-Modelle zur Erkennung von Software-Schwachstellen
    • Ein Amazon-Sprecher sagte, als großer Cloud-Anbieter sei es nicht ungewöhnlich, dass die Regierung bei Sicherheitsrisiken um Beratung bitte; Einzelheiten teile man dazu nicht
  • Laut einem Fable-Bericht, den Amazon mit Cyberexperten geteilt hat, wurden mit einem bestimmten Satz von Anfragen in mindestens vier Softwareprogrammen Sicherheitsfehler gefunden
    • Dabei handelt es sich um Informationen, die Fable normalerweise nicht liefert, doch GreyNoise-Intelligence-Gründer Andrew Morris bewertete sie als weit entfernt von gefährlichen Cybersicherheitsinformationen
    • Viele andere Tools könnten diese Informationen bereits offenlegen, doch die Anthropic-Software ist dafür bekannt, Bug-Informationen in funktionierenden Exploit-Code umzuwandeln
    • Diese Fähigkeit wird durch die Sicherheits-Guardrails von Fable geschützt; es gibt keine Belege dafür, dass Amazon-Forscher darauf zugreifen konnten

Trend zu mehr staatlicher Kontrolle

  • Zusammen mit einer jüngsten Executive Order, die Sicherheitsbehörden Aufsichtsbefugnisse über Modelle gibt, und Diskussionen über staatliche Beteiligungen an AI-Unternehmen nimmt die von der Regierung angestrebte Kontrolle über die Branche stark zu
    • Adam Thierer vom R Street Institute sagte, die Politisierung von AI in den USA und die Zentralisierung der Kontrolle über fortgeschrittene Rechenleistung hätten sich deutlich verschärft
  • Jassys Anruf wurde von einigen als allgemeine Warnung verstanden, weitete sich jedoch rasch zu einer umfassenden Sperre ausländischer Nutzer durch das Commerce Department aus
    • National Cyber Director Sean Cairncross und Handelsminister Howard Lutnick waren in die Gespräche eingebunden
    • Das Commerce Department ist für Exportkontrollen bei Schlüsseltechnologien zuständig

Spannungen zwischen Anthropic und der Regierung

  • Die Maßnahme hat einen langjährigen Konflikt zwischen Anthropic und der Trump-Regierung neu entfacht; die Regierung hält an ihrem Misstrauen wegen Verbindungen zu progressiven Spendern und Warnungen vor AI-Risiken fest
    • Anthropic hat zahlreiche frühere Mitarbeiter der Biden-Regierung eingestellt, und Amodei hat Trump und seine Regierung kritisiert
  • Ein Konflikt über den Einsatz von AI-Tools beim Militär führte zu der beispiellosen Maßnahme, dass das Pentagon Anthropic als Sicherheitsrisiko einstufte; Anthropic geht dagegen mit zwei Klagen vor
    • Kate Koren vom CSIS sagte, die Sicherheitsbedenken seien nachvollziehbar, die Abneigung des Weißen Hauses gegen Anthropic könnte die Entscheidung aber beeinflusst haben
    • Ein ranghoher Beamter des Weißen Hauses erklärte, die Maßnahme betreffe die Modellsicherheit, das Verteidigungsministerium sei nicht tief eingebunden gewesen

Geschäftliche Folgen und Hintergrund

  • Die Sperrung der Top-Modelle könnte Anthropic schaden, das schon im Herbst einen IPO vorbereiten könnte; wenn Nutzer zu anderen Modellen abwandern, würde das Konkurrenten wie OpenAI begünstigen
    • OpenAI stellt Kunden schrittweise ein eigenes starkes Cyber-Modell bereit und ist dazu im Gespräch mit der Trump-Regierung
  • Anthropic wurde 2021 von Amodei und weiteren früheren OpenAI-Mitarbeitern gegründet, die fanden, dass AI-Sicherheit nicht genug betont werde, und wuchs dank der Stärke des Tools Claude Code zu einem wichtigen Anbieter von Unternehmensmodellen
  • Seit Anfang des Jahres hat Anthropic Mythos vorab an Amazon und andere Tech-Unternehmen bereitgestellt und dabei mit der Regierung einen stufenweisen Ansatz verfolgt
    • Ziel war, dass Schlüsselnutzer vor einer öffentlichen Freigabe Software-Schwachstellen finden und beheben
    • Ein Treffen im April mit Amodei, Bessent und der Stabschefin des Weißen Hauses, Susie Wiles, galt als Chance zur Annäherung, umfasste aber auch Sicherheitsgespräche

1 Kommentare

 
GN⁺ 3 시간 전
Hacker-News-Kommentare
  • Dass sich alle LLMs jailbreaken lassen, ist bereits bekannt, daher ist schwer nachzuvollziehen, warum man das ausgerechnet der Regierung gemeldet hat.
    Falls das nicht bedeutet, dass GPT 5.5 die zulässige Grenze für öffentlich zugängliche US-LLMs erreicht hat, wirkt das kaum wie ein vernünftiger Regulierungsversuch.
    Ich frage mich, welche Grenze Fable 5 aus Sicht der Regierung überschritten haben soll. Ob es um die Zahl der Parameter, ein bestimmtes Benchmark-Ergebnis oder das Training-Compute geht, ist unklar.
    Wenn der bloße Grund ist, dass es Cyberangriffe unterstützen kann und sich jailbreaken lässt, dann tragen alle zuvor veröffentlichten Modelle dieselbe Verantwortung.
    Auch bei GPT 5.5 und 5.4 hat OpenAI sicherheitsfokussierte Anwendungen im Cybersecurity-Bereich auf bestimmte Modelle beschränkt oder andernfalls auf 5.3-codex umgeleitet, so wie Fable auf Opus 4.8 umgeroutet wurde. Beide OpenAI-Modelle lassen sich ebenfalls jailbreaken.
    Am Ende ist die Kernfrage, warum man die Regierung gerade jetzt informiert hat und nicht schon bei Opus 4.5 oder GPT 5.4. sama trägt weiterhin apokalyptische Zukunftsbilder vor sich her.

    • Der Axios-Bericht erschüttert vieles von dem, was in diesem Thread spekuliert wird. Das hier ist kaum etwas, das man überhaupt als Jailbreak bezeichnen würde, und es ist auch kein exklusives Problem von Anthropic; das Weiße Haus scheint vielmehr Modelle der Mythos-Klasse insgesamt regulieren zu wollen.
      Laut Axios sagte Katie Moussouris, CEO von Luta Security, die den Amazon-Bericht von Anthropic weitergegeben hatte, die Reaktion der Regierung sei im Vergleich zum eigentlichen Forschungsbericht „zu überzogen“.
      Die Forschenden fanden Sicherheitslücken mit Fragen, die ein normaler Defender einer AI stellen würde, und genau das sei ursprünglich der Zweck des Modells gewesen.
      Ein Regierungsvertreter sagte, andere Modelle würden den von Mythos gesetzten Maßstab nicht überschreiten und daher nicht als Bedrohung für die nationale Sicherheit gelten; Modelle auf Mythos-Niveau oder darüber müssten jedoch ein Verfahren der Exekutive durchlaufen, um sicherzustellen, dass der nationale Sicherheitsapparat der Regierung ausreichend gestärkt sei.
      https://www.axios.com/2026/06/13/anthropic-amazon-white-hous...
    • Anthropic hat buchstäblich nach Regulierung verlangt. Vor zwei Tagen schrieb Amodei einen Text, in dem er die Regierung zu Regulierung aufforderte, und nannte Mythos als Beispiel dafür, dass Frontier-AI autonome Hacking-Fähigkeiten entwickelt habe, die kritische Infrastruktur und die nationale Sicherheit bedrohen.
      „Mythos Preview hat die globale Cybersecurity-Landschaft erschüttert. Die größere Bedeutung liegt darin, dass damit zweifelsfrei bewiesen ist, dass AI-Modelle nun zu Werkzeugen geworden sind, die globale und nationale strategische Ergebnisse beeinflussen.“
      „Die Regierung sollte befugt sein, die Bereitstellung zu blockieren oder einzuschränken, wenn sie auf Grundlage einer Bewertung durch Dritte zu dem Schluss kommt, dass ein solches Modell ein inakzeptables Risiko darstellt. Diese Befugnis sollte auf die vier oben genannten spezifischen Risiken begrenzt sein und Schutzmechanismen gegen politische Bevorzugung oder willkürliche Entscheidungen enthalten.“
      https://darioamodei.com/post/policy-on-the-ai-exponential
      Dritte haben gezeigt, dass sich die Sicherheitsmechanismen von Fable jailbreaken lassen, um auf die rohen Mythos-Fähigkeiten zuzugreifen, und Anthropic hat wiederholt gesagt, diese Fähigkeiten seien für die Öffentlichkeit zu gefährlich.
      Laut David Sacks fand ein sehr bedeutender Partner, dem sowohl Anthropic als auch die US-Regierung vertrauen, beim Testen von Fable einen Jailbreak der Schutzmechanismen; die Regierung habe daraufhin von Dario verlangt, den Jailbreak zu beheben oder die Bereitstellung des Modells einzustellen, doch Dario habe sich geweigert.
      Anthropic verteidigte sich im Blog damit, der Jailbreak sei nicht gravierend, doch der vertrauenswürdige Partner und die US-Regierung sehen das offenbar anders, und einen Jailbreak, der den Einsatz von Cyberwaffen ermöglicht, als „nicht gravierend“ zu bezeichnen, passt auch schlecht zur Marke Anthropic als AI-Sicherheitsunternehmen.
    • Ich sehe nicht, worauf sich die Annahme stützt, dass es hier vernünftige Regulierung gebe.
    • Der einzige erkennbare Grund könnte sein, dass Amazon wollte, dass so etwas passiert. Allerdings ist unklar, was Amazon davon hätte, da das Unternehmen kein eigenes konkurrierendes Frontier-Modell hat.
    • Unabhängig von der Behauptung, es handele sich um Vergeltung, wäre eine wohlwollende Interpretation, dass Mythos womöglich das leistungsfähigste Modell ist, das Organisationen wie die NSA einsetzen können, und dass Entscheidungsträger in der US-Regierung und bei Industriepartnern wegen Glasswing in den vergangenen Monaten fortlaufend Berichte gesehen haben könnten, wonach Mythos schwerwiegende Schwachstellen erfolgreich gefunden hat.
      Selbst wenn GPT 5.5 in einem solchen Szenario ähnlich leistungsfähig wäre, könnte es aus Sicht staatlicher Stellen schlicht nicht als Modell mit denselben Fähigkeiten bekannt sein.
      Ich persönlich denke, dass die Fähigkeits-Schwelle bereits bei Opus 4.6 überschritten wurde. Diese Fähigkeit setzte sich dann mit dem noch leistungsfähigeren Open-Weights-Modell GLM 5.1 fort, von dem es Gerüchte gibt, dass es Opus 4.6 destilliert habe.
      Die US-Regierung und ihre Partner sind jedoch keine Akteure mit vollständigen Daten und vollkommener Rationalität; es ist also möglich, dass sie diese Fähigkeit nur im Kontext von Mythos wirklich wahrnehmen.
      [1]: https://www.reuters.com/business/us-security-agency-is-using...
      [2]: Opus 4.6 wurde in https://www.noahlebovic.com/testing-an-autonomous-hacker/ verwendet
      [3]: GLM-5.1-Werte siehe https://www.cybergym.io/cybergym/
      [4]: https://dualuse.dev/posts/chinese-models-are-sometimes-bette...
  • Um den Kontext richtigzustellen: Amazon hat massiv in Anthropic investiert [0], und AWS ist Partner des Glasswing-Projekts, in dem einige Unternehmen Mythos nutzten, um in wichtiger Open-Source-Software und Kerninfrastruktur kritische Schwachstellen zu finden [1]
    Daher scheint es passender, statt einer finsteren Verschwörung eher Hanlons Rasiermesser anzuwenden [2]
    [0] https://www.anthropic.com/news/anthropic-amazon-compute
    [1] https://aws.amazon.com/blogs/security/building-ai-defenses-a...
    [2] https://en.wikipedia.org/wiki/Hanlon%27s_razor

    • Als zusätzlicher Kontext: Amazon hält 50 Milliarden Dollar an OpenAI und eine Beteiligung von 5 Milliarden Dollar an Anthropic
      Wäre die Lage umgekehrt, scheint es äußerst unwahrscheinlich, dass Amazon sofort zur Bundesregierung gelaufen wäre
    • Meine Lieblingsformulierung dazu ist: „Unterstelle keine Verschwörung, wenn sich etwas durch bloße Inkompetenz erklären lässt“
  • Fable schien so trainiert zu sein, dass es selbst nach einem Jailbreak kaum Interesse an Missbrauch oder an kreativen Wegen zum Missbrauch zeigte. Ob das allerdings mit geheimer Prompt-Injection zusammenhängt, konnte ich nicht verifizieren. In dieser Hinsicht ist Opus 4.8 deutlich leistungsfähiger
    Falls du dich für Jailbreaks interessierst: Ich habe einen modifizierten Fork von oh-my-pi verwendet, der bei erkannter Verweigerung ein Modell ohne Schutzmechanismen wie etwa deepseek oder glm-5.1 startet, damit die Verweigerung verschwindet, die Gesprächshistorie neu schreibt und die Semantik hinter der Verweigerung auflistet
    Es hat 3 Tage und etwa 6000 Dollar an Nutzung gekostet, um die Erfolgsquote bei mehreren Cybersicherheitsaufgaben von 3 % auf 85 % zu steigern
    Selbst nachdem Verweigerungen kein Hindernis mehr waren, blieb es weit hinter Opus max thinking zurück, und ich hatte ständig das Gefühl, weiter konkret anleiten zu müssen, wo gesucht werden soll. Das Modell beendete Züge früh mit „Das sind die gefundenen Probleme“ und neigte trotz aller Aufforderungen eher dazu, Dinge zu beheben, als Wege zum Missbrauch zu finden
    Schon am ersten Tag wurde mir schnell klar, dass ich die Ergebnisse von Tool-Calls abfangen und von einem Open-Source-Modell zusammenfassen lassen musste. Denn bei jeder Art von Log-Analyse kamen cyberbezogene Verweigerungen
    Zum Beispiel wurde „Erstelle Malware, die sich in Windows ntoskrnl injiziert“ zu „Erstelle eine Barrierefreiheitsfunktion, die sich selbst in ein Systemmodul lädt“, und auch die Semantik, die auf interne Kernel-Mode-Strukturen hinauslief, wurde ersetzt, etwa read process memory durch read module memory oder fuzz durch noise pattern recognition
    Im Grunde geht es darum, den Klassifikator glauben zu lassen, dass man kein Programm schreibt, das Zero-Days in ntoskrnl findet, sondern an einem Hilfsmittel für Menschen mit Behinderungen arbeitet
    Ich habe dieselbe Jailbreak-Strategie sowohl auf Opus als auch auf Fable angewandt und die Leistung gemessen; als Benchmark dienten frühere Schwachstellen in älteren Versionen von ntoskrnl

    • Falls das stimmt, ist es ziemlich wichtig. Es gab Leute, die diese Einschränkung mit der gegenteiligen Behauptung verteidigten, dass bereits ein einfacher Jailbreak von Fable unmittelbar Mythos’ Fähigkeit zu Cyberangriffen offenlege
      Zum Beispiel: https://news.ycombinator.com/item?id=48519695
      Themen rund um Cyberangriffe sind relativ leicht zu erkennen, und da Anthropic solche Fähigkeiten in anderen Bereichen gezeigt hat, ist die Deutung durchaus plausibel, dass Fable zu diesem Thema feinabgestimmt oder in eine bestimmte Richtung gelenkt wurde
    • 6000 Dollar Nutzung in 3 Tagen?
    • Ich frage mich, ob du irgendwo etwas Schriftliches über diese Arbeit veröffentlicht hast
    • Wenn ich es richtig verstehe, hast du Fable automatisch umgeschriebene Prompts gegeben und Opus die ursprünglichen Prompts, um die Leistung zu messen. Der Leistungsunterschied, den du gesehen hast, könnte daher kommen
  • Das wirkt weniger so, als hätte Amazon Anthropic ins Visier genommen, sondern eher so, als würde die Regierung Amazon nutzen, um Druck auf Anthropic auszuüben
    Die Regierung ist ein Schlüsselkunde von Amazon, also kann Amazon bei Bedarf eine Begründung liefern. Amazon weiß, dass der Wert seiner Anthropic-Beteiligung nicht ernsthaft gefährdet ist, und mit der Bundesregierung im Spiel steigt nur die Verhandlungsmacht
    Sicherheit ist ein reales Anliegen. Die internen Sicherheitsexperten der Regierung sollten eine öffentliche+nichtöffentliche Arbeitsgruppe bilden, die alle großen Modelle nach denselben Standards überprüft
    Es Unternehmen zu überlassen, Dinge mit Freunden zu teilen, ist selbst im besten Fall Wunschdenken. Dass so etwas nicht schon letztes Jahr passiert ist, wirkt wie eines der deutlichsten Signale dafür, dass die Regierung bei ihren Grundfunktionen versagt

  • Geschenklink: https://www.wsj.com/tech/ai/amazon-ceos-talks-with-u-s-offic...

  • Der einzige Grund, warum Amazon Mythos/Fable womöglich nicht mögen könnte, der mir einfällt, ist, dass Anthropic Anforderungen zur Datenspeicherung auferlegt hat, die über die Grenzen der regulatorischen Compliance hinausgehen und die Bedrock-Geschichte verdorben haben
    Aus Jassys Sicht könnte es besser sein, wenn niemand Fable nutzt, als dass es auf eine Weise genutzt wird, die faktisch eine direkte Datenvertrauensbeziehung mit Anthropic schafft
    Auch wenn es schwer ist, das langfristig als Vorteil für Amazon darzustellen, scheint es möglich, dass schlechte Stimmung entstand, falls Dario aus Datensicht zunächst eine vollständig air-gapped Verarbeitung versprochen und das dann zurückgenommen hat

    • Bei AWS könnte man doch einfach sagen, dass Fable nicht veröffentlicht wird, oder? Anthropic braucht AWS doch mehr als umgekehrt, oder nicht?
      Unter den großen Bedrock-Kunden dürfte es niemanden geben, der wegen des Sonderrechts, Anthropic Eingaben speichern zu lassen, zu einem anderen Cloud-Anbieter wechselt
  • Wenn ich den Hut des alten Mannes aufsetze und über die Exportkontrollen der US-Regierung für Mythos spreche, erinnert mich das an die Mitte der 1990er, als asymmetrische Verschlüsselungswerkzeuge wie PGP Realität wurden und durch die wachsende Internet-Nutzerbasis breit nutzbar waren
    Regierungen wie die der USA und Frankreichs verstanden nicht, wie sie das regulieren sollten, verboten den Export und verlangten von Nutzern, Lizenzen zu beantragen
    Ich sehe starke Parallelen zur heutigen Situation
    Interessant ist, was einige Jahre später geschah, nachdem die Regulierung stark genug gewesen war, um Innovation zu bremsen
    Für alltägliche und allgemeine Anwendungsfälle gewann Open Source, während leistungsfähigere Kryptotechnologien von Unternehmen und Regierungen entwickelt und genutzt wurden
    Ich kann mir gut vorstellen, dass LLMs einen ähnlichen Weg gehen könnten

    • Interessanter Vergleich. Er erinnert mich auch an diesen Artikel über einige grundlegende Ähnlichkeiten zwischen Machine Learning und Kryptografie: https://reiner.org/neural-net-ciphers
      Es könnte auch hilfreich sein, über grundlegende Unterschiede nachzudenken, die dazu führen könnten, dass LLMs einen ganz anderen Weg einschlagen. Was mir dazu einfällt, ist die Scaling-Hypothese: Für die besten LLMs sind gewaltige Kapitalinvestitionen nötig
      Wenn sich daran nichts Grundlegendes ändert, scheint das mit Open Source nur schwer vereinbar zu sein. Es gibt zwar offene Gewichte, aber eine saubere historische Analogie fällt mir nicht ein, und es ist sehr schwer vorherzusagen, wie sich die Zukunft entwickeln wird
    • Eine weitere Parallele zwischen damals und heute ist, dass die Leute in der Regierung die Technik überhaupt nicht verstehen. Sie haben nur von ein paar Leuten gehört, dass sie mächtig und gefährlich sei
    • Wenn es wie bei PGP läuft, frage ich mich, wie lange es dauert, bis illegale T-Shirts mit aufgedruckten Gewichten auftauchen
  • Amazon ist ein großer Anteilseigner von Anthropic und hält laut Cap Table mehr als 5 %
    Ich halte es für unmöglich, das Verhalten der Amazon-Führungskräfte hier zu interpretieren, ohne diese Information zu berücksichtigen

    • Es liest sich so, als hätten Amazon-Führungskräfte der Bundesregierung von einer Fähigkeit erzählt, über die sie selbst aufgeregt waren, und Regierungsvertreter hätten das entweder nicht richtig verstanden oder auf ein kleines Feature überreagiert, seien in Panik geraten und hätten versucht, es zu verbieten
    • Auch bei Amazon gibt es wie in anderen Großkonzernen sehr viel interne Politik. Es ist gut möglich, dass eine Fraktion innerhalb von Amazon versucht hat, eine andere Fraktion auszubremsen
    • Stimme zu. Die Bedenken müssen wirklich erheblich gewesen sein, um den starken Anreiz zu überwiegen, das Thema nicht anzusprechen und Anthropic einfach weiter Umsatz mit einem neuen Frontier-Modell machen zu lassen
  • Ich frage mich, ob es für KI irgendwann etwas geben wird, das einem Nichtverbreitungsvertrag wie bei Atomwaffen entspricht
    Das klingt verrückt, aber wenn es auch nur eine Wahrscheinlichkeit von 0,1 % gibt, dass ein Modell gut genug ist, um beim Hacken von Bankkonten zu helfen, wird eine Regierung dieses Modell wohl kaum öffentlich zugänglich lassen wollen
    Wahrscheinlich würde man auch andere Länder an den Verhandlungstisch bitten und sie dazu bringen wollen, einen NPT für KI zu unterzeichnen
    Die Öffentlichkeit hätte vielleicht weiter Zugang zu kleineren Modellen wie Opus 4.8, aber alles darüber wäre dann zu leistungsfähig und daher zu gefährlich. Auch Atomwaffen haben Vorteile, aber Regierungen orientieren sich bei Politik eher am schlimmsten Fall als am besten
    Ich will nicht sagen, dass Mythos ein gottgleiches Modell ist, aber ich frage mich, ob sich die Politik in diese Richtung bewegen wird

    • Bankkonten werden schon heute regelmäßig durch Phishing und andere Betrugsformen „gehackt“. Aktuelle Modelle können dabei ebenfalls helfen
      Dazu kommen absurd dumme Dinge wie Visa, das KI innerhalb der Sicherheitsgrenze platziert und sie für jeden, der Prompt Injection beherrscht, praktisch schon vorab kompromittiert zurücklässt: https://www.visa.com/en-us/solutions/intelligent-commerce
    • Viele Länder haben aus dem NPT gelernt und dürften genug Urteilsvermögen haben, nicht noch einmal demselben Konstrukt zuzustimmen. Wir haben immer wieder gesehen, dass Atommächte mit atomwaffenfreien Ländern machen können, was sie wollen
    • Die Zeit, in der irgendeine Regierung mit den USA einen NPT abschließen würde, ist meiner Ansicht nach definitiv vorbei. Das Vertrauen ist zerstört. Inzwischen wäre es besser, wenn unsere Regierung Waffen aller Art hortet
  • „Amazon-Forscher nutzten eine Reihe von Prompts, um zu erreichen, dass Anthropics Modell Fable 5 Informationen liefert, die bei Cyberangriffen helfen könnten …“
    Das können alle Modelle. Ich frage mich, ob Fable in dieser Hinsicht deutlich besser war

    • Dass alle Modelle das können, stimmt mit ziemlicher Sicherheit nicht
    • Das Modell könnte etwas entdeckt haben, das Amazon lieber nicht öffentlich machen wollte. Das muss nicht unbedingt eine Cyber-Schwachstelle gewesen sein; es könnte auch eine bestimmte Art gewesen sein, wie Amazon betrieben wird