- Vor einer KI-Anhörung im US-Senat behauptete Anthropic, die mit Alibaba verbundenen Aktivitäten seien der größte derartigen Angriff gewesen, der gegen das Unternehmen gerichtet war
- Der zentrale Mechanismus sei Destillation (distillation), bei der ein schwächeres Modell mit den Ausgaben eines stärkeren Modells trainiert wird; Anthropic geht davon aus, dass China dadurch schneller Fähigkeiten auf dem Niveau von Mythos Preview erreichen könnte
- Vom 22. April 2026 bis zum 5. Juni gab es mehr als 28,8 Millionen Interaktionen mit Claude; dabei seien fast 25.000 betrügerische Konten verwendet worden
- Anthropic erklärte, die Betreiber seien mit Alibaba und dem KI-Forschungslabor Alibaba Qwen verbunden; Alibaba reagierte nicht sofort auf eine Bitte von Reuters um Stellungnahme
- Anthropic unterstützt den Austausch von Bedrohungsinformationen und gemeinsame Gegenmaßnahmen zwischen der US-Regierung und privaten KI-Unternehmen, zugleich wurden im selben Zeitraum aber auch Zugriffsbegrenzungen für die eigenen Modelle Mythos und Fable verhängt
Vorwürfe der rechtswidrigen Extraktion im Zusammenhang mit Alibaba
- Anthropic erklärte in einem an den US-Senat gerichteten Schreiben, dass das chinesische Technologie- und E-Commerce-Unternehmen Alibaba Fähigkeiten der Claude-AI-Modelle rechtswidrig extrahiert habe
- Laut dem von Reuters eingesehenen Schreiben bewertet Anthropic diese Aktivität als den größten derartigen Angriff, den das Unternehmen bislang festgestellt hat
- Alibaba reagierte nicht sofort auf eine Bitte von Reuters um Stellungnahme
Destillationsmethode und Umfang des Angriffs
- Anthropic bezeichnete die Aktivität als Versuch der Destillation (distillation)
- Destillation ist ein Verfahren, bei dem ein relativ schwächeres Modell mit den Ausgaben eines leistungsfähigeren Modells trainiert wird
- Der Zeitraum der Kampagne war 22. April 2026 bis 5. Juni
- In diesem Zeitraum wurden gegen Claude mehr als 28,8 Millionen Interaktionen gezählt
- Verwendet wurden fast 25.000 betrügerische Konten
- Anthropic sieht in der Destillation einen Weg, mit dem China schneller die fortgeschrittenen Fähigkeiten von Mythos Preview von Anthropic erreichen könnte
Behauptete Verbindung zu Alibaba Qwen und Empfänger des Schreibens
- Anthropic behauptete, die Kampagne sei von Akteuren durchgeführt worden, die mit Alibaba und Alibabas KI-Forschungslabor Alibaba Qwen verbunden seien
- Das Schreiben ist auf den 10. Juni datiert
- Empfänger sind der Vorsitzende und die ranghöchste Demokratin des US-Senatsausschusses für Bankenwesen, Tim Scott und Elizabeth Warren
- Das Schreiben wurde im Vorfeld einer geplanten KI-Anhörung versandt
Frühere Fälle mit chinesischen KI-Forschungslabors
- Anthropic erklärte, bereits im Februar 2026 eine Kampagne identifiziert zu haben, bei der das chinesische KI-Startup DeepSeek und zwei weitere chinesische KI-Forschungslabors versucht hätten, Fähigkeiten von der Claude-AI-Plattform rechtswidrig zu extrahieren
- Die von Anthropic damals genannten Größenordnungen waren wie folgt
- DeepSeek: mehr als 150.000 Interaktionen
- Moonshot AI: mehr als 3,4 Millionen
- MiniMax: mehr als 13 Millionen
- Anthropic erklärte damals, dass Intensität und Raffinesse dieser Kampagnen zunähmen und eine schnelle sowie koordinierte Reaktion von Industrie, politischen Entscheidungsträgern und der globalen KI-Community nötig sei
Maßnahmen der US-Regierung und Beschränkungen für Anthropic-Modelle
- Anthropic erklärte, die Reaktionsbemühungen der US-Regierung zu unterstützen
- einschließlich des Austauschs von Bedrohungsinformationen mit privaten KI-Unternehmen
- sowie weiterer gemeinsamer Gegenmaßnahmen
- Im April 2026 beschuldigte das Weiße Haus China, geistiges Eigentum von US-KI-Forschungslabors in industriellem Maßstab zu stehlen
- Alibaba wurde im selben Monat auf die Liste chinesischer Militärunternehmen des US-Verteidigungsministeriums gesetzt; Alibaba ficht diese Einstufung an
- Das US-Handelsministerium verzichtete trotz der Einstufung von DeepSeek als Risiko für die nationale Sicherheit in einem behördenübergreifenden Ausschuss auf eine Aufnahme in die Handels-Blacklist, um eine weitere Eskalation der Spannungen mit Beijing zu vermeiden
- Zwei Tage nachdem Anthropic das Schreiben versandt hatte, am 12. Juni, verhängte das US-Handelsministerium Beschränkungen für die neuesten KI-Modelle Mythos und Fable von Anthropic
- Die Behörden befürchten, dass diese Modelle bei militärischen Nachrichtendienstnutzern in China und anderen besorgniserregenden Ländern eingesetzt werden könnten
- Aufgrund dieser Beschränkungen deaktivierte Anthropic den Zugang zu diesen Modellen weltweit
1 Kommentare
Hacker-News-Kommentare
Ich lasse das mal hier: „Ein Richter entschied, dass Anthropics Herunterladen von mehr als 7 Millionen Büchern von Piraterieseiten wie LibGen eine Verletzung darstellte, und verwarf auch Anthropics Verteidigung mit dem ‚Forschungszweck‘: ‚Man kann nicht einfach selbst den Forschungszweck absegnen und sich dann beliebige Lehrbücher nehmen, die man will.‘“
https://www.joneswalker.com/en/insights/blogs/ai-law-blog/wh...
Es gibt im Wesentlichen zwei Arten von Distillation. 1) die groß angelegte, dumme Methode der Blackbox, bei der man Fragen stellt und die Antworten als Verstärkungssignal nutzt, 2) die stärker zielgerichtete Distillation, bei der ein Modell ein anderes direkt anleitet, trainiert und steuert (RLAIF)
Letzteres ist im Grunde nichts anderes, als ein Modell anhand der Orientierung eines anderen feinzujustieren. Unzählige Unternehmen machen täglich genau so Fine-Tuning. Chinesische Labore nutzen diese Methode mit ziemlicher Sicherheit ebenfalls, weil sie für das Endergebnis viel wirksamer ist als bloß simple Antworten auf simple Fragen abzugreifen
Diese Beschwerden über Distillation sollen das Problem größer erscheinen lassen, als es ist, und scheinen dem protektionistischen Ziel zu dienen, die US-Regierung dazu zu bringen, chinesische Modellanbieter zu blockieren oder zu verbieten. Man hat bereits schärfere Chip-Exportkontrollen gefordert, was angesichts von DeepSeek v4, das für den Betrieb auf Huawei-Chips ausgelegt wurde, und anderer chinesischer Firmen, die nachziehen, schon fast komisch ist. Aber das kann man nicht offen sagen, also behauptet man, dass distillierte Modelle womöglich nicht so sicher seien wie die eigenen und man deshalb mehr Exportkontrollen brauche. Wenn man dann Jailbreaks vorführt, die die Sicherheitsmaßnahmen des eigenen Modells umgehen, heißt es wiederum, man solle sich keine Sorgen um Sicherheit machen, weil letztlich jedes Modell jailbreakt werden könne
2) Es sei unmöglich, ein Large Language Model zu bauen, das gegen alle Jailbreaks immun ist. Auch dafür gebe es keine glaubwürdigen Gegenbelege, also hat Anthropic hier vollständig recht
Falls 1 falsch ist, könnte man einfach die Jailbreak-Details veröffentlichen. Er funktioniert angeblich nur bei Fable 5, also besteht auch kein mögliches Risiko
Falls 2 falsch ist, hätte ein anderes LLM-Labor das längst geschafft haben müssen. Mehrere Regierungen haben ja klar gemacht, dass es für solche Projekte einen Markt gibt
Grundsätzlich ist es sehr schwer, das zu verhindern und ein KI-Modell zugleich nützlich zu halten
Das erinnert mich an Steve Jobs in den mittleren bis späten 1980ern, als er sich beschwerte, dass der Mac-GUI kopiert worden sei. Dabei erkannte er die Arbeit, die bereits in Xerox Alto und dem Star-Betriebssystem geleistet worden war, öffentlich nicht an
„Du willst doch nur etwas kopieren, das ich schon kopiert habe!“
Es wirkt genauso, wenn man das ganze Internet crawlt, riesige Large Language Models baut und sich dann darüber beschwert, kopiert zu werden
Informationen wollen wirklich frei sein, aber KI-Unternehmen wollen Türsteher sein. Langfristig wird sich meiner Meinung nach der nachhaltigere Ansatz mit offenen Gewichten durchsetzen
Es ist wirklich lächerlich, wie Anthropic sich darüber beschwert, dass „die Fähigkeiten des Claude-AI-Modells illegal extrahiert wurden“, und damit die Vorwürfe des Weißen Hauses stützt, China stehle „im industriellen Maßstab geistiges Eigentum amerikanischer AI-Labore“
Anthropic, OpenAI, Google, Microsoft usw. haben ihre Modelle trainiert, indem sie wahllos Inhalte eingesammelt und dabei die Rechte der Urheber ignoriert haben. Und jetzt ruft eines von ihnen plötzlich, es sei unfair, wenn jemand anderes genau das tut, was sie alle selbst getan haben
robots.txtzu ignorieren und die Bandbreitenkosten in die Höhe zu treiben. Aber wenn Datensammlungspraktiken Kosten für AI-Anbieter verursachen, dann soll das plötzlich völlig inakzeptabel seinDas, was gerade passiert, sieht so aus: Chinesische Wiederverkäufer bieten Claude-Token zu Preisen an, die 70–90 % unter den offiziellen Anthropic-API-Preisen liegen. Sie erreichen das, indem sie Claude-Max-Konten bündeln und deren Kapazität weiterverkaufen, Zahlungsbetrug einsetzen und Modellausgaben sowie Reasoning-Ketten an mehrere chinesische Institute weiterverkaufen. Sie erleichtern den Modellzugang im Austausch gegen Nutzerprotokolle und Inferenzspuren und können unter Einstandskosten arbeiten, weil sie diese als Trainingsdaten verkaufen
Claude und ChatGPT sind beide in China gesperrt. Für den Zugriff braucht man ein VPN, und mit chinesischen Bankkarten kann man nicht bezahlen. Deshalb kaufen die meisten, die Zugang zu Claude wollen, ihre Zugangsrechte über Wiederverkäufer. Das ist in China der einfachste und billigste Weg, an Anthropic-Modelle zu kommen
Diese Wiederverkäufer betreiben Zehntausende Bot-Konten, und genau deshalb hat Anthropic eine Identitätsprüfung eingeführt, um die Bot-Wellen zu verlangsamen
Ein Token-Wiederverkäufer bietet Opus 4.8 mit 93 % Rabatt gegenüber den offiziellen API-Tarifen an: https://yunwu.ai/pricing?provider=Anthropic
Das ist einer der Gründe, warum DeepSeek- und GLM-Preise so niedrig sind. Sie müssen in China mit absurd niedrigen Tokenpreisen konkurrieren, also müssen sie die Preise niedrig halten, damit die Leute sie überhaupt nutzen
Ich habe das vor ein paar Monaten schon geteilt, aber kaum Reaktionen bekommen. Das ist ein großartiger Artikel, der die chinesische Token-Wiederverkaufsökonomie erklärt: https://www.chinatalk.media/p/how-to-buy-cheap-claude-tokens...
Ich habe auch gelernt, dass Anthropic seine Arbeit besser machen muss, wenn es konkurrieren will. Sonst gewinnt eben jemand anderes
Gilt dieses Prinzip jetzt nicht mehr für große US-Konzerne
DeepSeek und GLM sind Open Weights, und auch US-Inferenzanbieter verkaufen viel günstiger. Der Grund für die niedrigen Preise ist, dass die Modelle effizienter sind
Wenn nicht, klingt das nach dem typischen Gerede von AI-Bären, dass „Anthropic/OpenAI 1.000 Dollar an Token für 100 Dollar verkauft und dadurch riesige Summen verliert“
Alibabas Vorgehen wird als Versuch der „Destillation“ beschrieben, und Anthropic sagte, das bedeute, ein schwächeres Modell mit den Ausgaben eines stärkeren Modells zu trainieren
Claude hat Terabytes an Inhalten ohne Erlaubnis zum Training des eigenen Modells verwendet, und das soll in Ordnung gewesen sein. Jetzt schreit man auf, weil jemand die Ausgaben des Claude-Modells zum Training eines Modells benutzt hat
Ich freue mich auf einen Prozess, in dem Anthropic die Herkunft seiner Trainingsdaten offenlegen und erklären muss, warum es selbst das Recht haben soll, wiedergekäute Trainingsdaten gegen Bezahlung an Kunden auszugeben, Alibaba aber nicht das Recht haben soll, sein Modell mit Anthropic-Modellen zu trainieren
Könnte unterhaltsam werden
Das Verhalten von Anthropic wirkt wie eine performative Geste. Andere haben bereits vermutet, wer das Zielpublikum dafür sein dürfte
Was genau daran soll eigentlich illegal sein
Rechtlich können Modellausgaben weder nach nationalem noch nach internationalem Recht als geistiges Eigentum geschützt werden. Das Äußerste, was man erwarten kann, ist zivilrechtliche Abhilfe, und selbst das erscheint fraglich, wenn man bedenkt, dass die Art, wie sie ihre Modelle trainiert haben, buchstäblich selbst rechtswidrig war
Anthropic wurde genauso behandelt, wie es selbst alle anderen behandelt hat. Sie haben sich dieses Bett selbst gemacht, jetzt müssen sie auch darin liegen
Dass Alibabas Vorgehen eine sogenannte „Destillation“ sei, bei der ein schwächeres Modell mit den Ausgaben eines stärkeren Modells trainiert wird, aber ich verstehe nicht, was daran falsch sein soll.
Anthropic sagte, diese Kampagne habe vom 22. April 2026 bis zum 5. Juni stattgefunden und über fast 25.000 betrügerische Konten mehr als 28,8 Millionen Interaktionen mit Claude erzeugt.
Was macht diese Konten zu Betrug? Wenn der vereinbarte Preis gezahlt wurde, ist es dann nicht in Ordnung? Falls nicht gezahlt wurde, warum hat Anthropic den Dienst dann bereitgestellt?
Destillation lässt sich grundsätzlich nicht verhindern. Alles, was man tun kann, ist sie zu verlangsamen. Widerlegt das.
Am Ende werden chinesische Firmen Erweiterungen wie Honey herausbringen, sich auf echte nichtchinesische Kunden draufsetzen und sowieso alles nach China schicken.
Es ist vorbei.
KI-Labore können aber weiterhin enormen wirtschaftlichen Wert schaffen, ohne ihre Modelle offenzulegen und sie damit potenzieller Destillation auszusetzen. Sie könnten Modelle zum Beispiel nur intern verwenden, um Medikamente zu entwickeln.
Hoffentlich gibt es irgendwann eine Zukunft, in der auch andere Zugang zu Frontier-Modellen haben, aber wenn man entscheidet, dass es wichtiger ist, die Verbreitung durch Destillation zu verhindern, ist das nicht zwingend nötig.
[1]: Verweis zur Destillation in https://dualuse.dev/posts/export-controls-on-fable
Der Punkt ist, dass es vielleicht keine technische Lösung gibt, theoretisch aber eine politische Lösung geben könnte.
Berkeleys „False Promise of Imitating Proprietary LLMs“ kam ebenfalls zu dem Schluss, dass Nachahmung die Stil-Lücke zwar schnell verringert, die Fähigkeitslücke aber groß bleibt.
https://arxiv.org/abs/2305.15717