DeepSeek soll KI-Modelle mit verbotenen Nvidia-Chips entwickelt haben
(finance.yahoo.com)- Das chinesische KI-Start-up DeepSeek soll mit den von den USA verbotenen Nvidia-Blackwell-Chips ein neues KI-Modell entwickelt haben
- The Information berichtet, dass diese Chips in Rechenzentren von Drittstaaten, in denen der Verkauf erlaubt ist, zerlegt und anschließend nach China geschmuggelt wurden
- Die USA verbieten den Export fortschrittlicher Halbleiter nach China, doch einige Entwickler greifen über ausländische Rechenzentren oder Umgehungswege darauf zu
- Nvidia hat in Bezug auf die Berichte erklärt, dass eine derartige Praxis nicht bestätigt werden konnte, und angekündigt, bei Eingang entsprechender Hinweise zu prüfen
- Dieser Fall zeigt, dass chinesische KI-Unternehmen im Umfeld des US-China-Technologiekonkurses aktiv daran arbeiten, Hochleistungschips zu beschaffen
Verdacht auf den Einsatz verbotener Chips durch DeepSeek
- DeepSeek hat laut The Information neue KI-Modelle mit Nvidia-Blackwell-Chips, die unter US-Exportbeschränkungen fallen, entwickelt
- Diese Chips wurden danach angeblich in Rechenzentren in Ländern installiert, in denen deren Verkauf erlaubt ist, und anschließend nach China verbracht
- Sie seien über ein Unternehmen importiert worden, das die Prüfung für Server-Equipment-Hersteller passiert habe
- Die USA verbieten den Export fortschrittlicher Halbleiter nach China
- Dadurch gibt es in China Fälle, in denen KI-Entwickler ausländische Rechenzentren oder inoffizielle Kanäle nutzen, um Chips zu beschaffen
US-Exportkontrollen und zugehörige Vorfälle
- Im November wurden zwei chinesische Staatsbürger und zwei US-Bürger von US-Behörden angeklagt
- Ihnen wird vorgeworfen, eine Immobilienfirma gegründet zu haben, um Chips über Malaysia nach China zu schmuggeln
- Diese Fälle werden als Teil von Umgehungsgeschäften nach der Verschärfung der US-Halbleiter-Exportkontrollen eingeordnet
Nvidias Position
- Nvidia betonte: „Wir haben keinen Nachweis oder Hinweis auf solche Schmuggelpraktiken erhalten“
- Ein Sprecher sagte, ein solcher Schmuggel sei unwahrscheinlich, verwies aber darauf, dass Hinweise untersucht würden
Hintergrund von DeepSeek und Entwicklung von KI-Modellen
- DeepSeek kündigte im Januar 2024 die Entwicklung eines KI-Modells an, das mit den besten Modellen aus dem Silicon Valley konkurrieren könne, zu niedrigen Kosten
- Das Unternehmen erhielt Unterstützung vom chinesischen Hedgefonds High-Flyer und wurde Anfang 2021 mit 10.000 Nvidia-GPUs versorgt
- Das geschah vor der Verhängung der US-Exportbeschränkungen
- Im September 2024 stellte es ein neues Modell vor und gab an, mit chinesischen Chip-Herstellern zusammenzuarbeiten
Neueste US-Maßnahmen und Reaktion Chinas
- Präsident Donald Trump hat zu Beginn dieser Woche den Export von Nvidias älterem KI-Beschleuniger H200 nach China erlaubt
- Die Exportbeschränkung für den leistungsstärkeren Blackwell-Chip bleibt jedoch weiterhin in Kraft
- Die chinesische Regierung ruft einheimische Tech-Unternehmen dazu auf, die Nutzung heimischer Ausrüstung zu erhöhen
- Auch DeepSeek folgt diesem Ansatz und setzt auf die Zusammenarbeit mit chinesischen Chip-Herstellern
1 Kommentare
Hacker-News-Kommentare
Dass DeepSeek das Modell mit Nvidia-Chips trainiert hat, die vor dem US-Exportverbot für Massenhalbleiter gesichert wurden, war bereits bekannt
Manche halten es für möglich, dass später über inoffizielle Wege weitere Chips beschafft wurden
Anderswo habe ich außerdem gelesen, dass Ausgabedaten von ChatGPT, Claude und Gemini als Trainingsdaten verwendet wurden
Wenn man gestohlene Daten gegenseitig erneut stiehlt, überrascht ein bisschen Schmuggel auch nicht
Sogar der US-Präsident hat eingeräumt, dass solche Sanktionen dem Protektionismus dienen
Auch Anthropic hat wegen Urheberrechtsverletzungen 1 Milliarde Dollar als Vergleich gezahlt, und letztlich sind alle Modelle das Ergebnis eines massiven Diebstahls von geistigem Eigentum und persönlichen Daten der Menschheit
Ich unterstütze die Überzeugung, dass offene Modelle geschlossene schlagen werden
Allerdings enthält die TOS von OpenAI eine Klausel, dass sie nicht zum Training konkurrierender Modelle verwendet werden dürfen, was ironisch ist
Die Nutzung der Ausgaben anderer Modelle zum Training nennt man Knowledge Distillation
Früher begannen auch Grok-Modelle ihre Antworten manchmal mit „as a model trained by OpenAI…“
Die Dokumentation von GamersNexus erklärt die Schwarzmarktstruktur für NVIDIA-AI-GPUs sehr gut
Sie behandelt, wie Unternehmen wie DeepSeek US-Exportverbote umgehen, um an Chips zu kommen
Der Höchstbietende hatte zwar einen australischen Account, aber die Lieferadresse war ein gewöhnliches Wohnhaus in Delaware, USA, und auch der Name war anders
In solchen Fällen heißt es meist, dass chinesische Studierende oder Auswanderer GPUs kaufen und weiterverkaufen
Wahrscheinlich wird auch meine 4090 in China als Frankenstein-GPU mit modifiziertem VRAM wiedergeboren
Sobald die Grenze überschritten ist, befindet sich die GPU bereits in China
Nur beim Hereinbringen ist es „Schmuggel“; sobald es in China ist, ist es nicht illegal
Dass DeepSeek solche GPUs nutzt, ist völlig erwartbar
Sanktionen erhöhen nur die Kosten ein wenig, machen es aber nicht unmöglich
Elektronische Bauteile, Öl oder auch der Zugang zu ChatGPT sind am Ende mit genug Geld doch zu bekommen
Allerdings könnten solche sanktionierten Güter auch für Propaganda missbraucht werden
Man stelle sich etwa vor, man müsste bei der Installation von Nvidia-Treibern Fragen zum „Tian’anmen-Zwischenfall“ beantworten
Einen Lastwagen voller GPUs zu transportieren ist deutlich einfacher als Drogen
Auf öffentlichen Plattformen ist es aber verboten
Deshalb bezweifle ich, wie wirksam so eine Propagandastrategie in der Praxis wäre
Selbst wenn man Russlands Schmuggelflotte für Öl nicht komplett stoppt, kann allein ein Klima der Angst die Gewinne verringern
Bloomberg formulierte es als „in China verbotene Chips“,
aber ein US-Exportverbot ist etwas anderes als ein Verbot innerhalb Chinas
Verwandter Artikel (Al Jazeera)
Es gab viele Fälle, in denen sie etwa Betreiber von Torrent-Seiten oder mit WikiLeaks verbundene Personen im Ausland festnehmen und ausliefern lassen wollten
Sogar Entführung und Folter von Ausländern wurden unter Verweis auf den Status als „feindliche Kämpfer“ schon gerechtfertigt
Ich denke, die Welt wäre besser dran gewesen, wenn die USA andere Länder nicht unterdrückt hätten
Alle Großmächte haben den Instinkt, ihre Stellung zu verteidigen
Die US-Sanktionen sind weniger bloßer Protektionismus als vielmehr eine Reaktion auf unfairen Wettbewerb
Merkwürdig ist, dass in dieser Diskussion die Cloud-Zugänglichkeit überhaupt nicht erwähnt wird
H100s auf US-Servern zu mieten war ganz ohne Einschränkungen möglich
Normale Nutzer kommen nur schwer an Infrastruktur auf diesem Niveau
Vielleicht wäre nicht einmal ein Neustart nötig
Das ist weder überraschend, noch glaube ich, dass irgendetwas passieren wird
Wenn der Herstellungsort im Nachbarland liegt, gibt es immer Wege, an Chips zu kommen
Solange man Nvidias Verkäufe ins Ausland nicht vollständig verbietet, sind die Sanktionen wenig wirksam
Dass Regierungen GPU-Käufe per Lizenzsystem verwalten, ist ebenfalls unrealistisch
Die von GamersNexus beschriebene Haltung, „ein Auge zu schließen und das andere offenzuhalten“, trifft es genau
China hat angewiesen, die Nutzung von Nvidia-Chips zu beenden, aber tatsächlich ist das eher ein Signal zur Förderung der Eigenständigkeit
Auch die US-Sanktionen sind wie der Krieg gegen Drogen eine Politik mit vorprogrammiertem Scheitern
Noch idealer wäre es natürlich, wenn das ohne Zwang und wirklich freiwillig geschieht
Falls die diesmal verwendeten Chips vor dem Verbot legal gekauft wurden,
könnte die ganze Kontroverse in Wahrheit bedeutungslos sein
Es gab Gerüchte, dass DeepSeek Sanktionen umgangen und durch Bootstrapping mit den Parametern anderer Modelle die Kosten gesenkt habe
Der aktuelle Bericht stützt diese Gerüchte
Ich halte es praktisch für schwierig, Handel zwischen zwei Ländern vollständig zu unterbinden
GPUs sind Güter mit geringem Volumen, die man nicht per Satellit verfolgen kann,
also etwas anderes als Öl, bei dem die Infrastruktur sichtbar ist