OpenAI erklärt, Beweise dafür gefunden zu haben, dass DeepSeek seine Modelle zum Training genutzt hat

(ft.com)

5 Punkte von GN⁺ 2025-01-30 | 2 Kommentare | Auf WhatsApp teilen

OpenAI teilte der Financial Times mit, Beweise dafür gefunden zu haben, dass das chinesische KI-Startup DeepSeek seine proprietären Modelle genutzt habe, um ein konkurrierendes Open-Source-Modell zu trainieren
Es besteht der Verdacht, dass DeepSeek die Technik der "Knowledge Distillation" eingesetzt hat, bei der die Ausgaben großer Modelle genutzt werden, um kleinere Modelle effektiv zu trainieren
Distillation ist in der KI-Branche ein gängiges Verfahren, doch OpenAI argumentiert, dass DeepSeek mit dessen Hilfe ein eigenes Modell entwickelt habe und damit gegen die Nutzungsbedingungen des Unternehmens verstoßen habe
Laut den OpenAI-Bedingungen dürfen Nutzer die Ausgaben von OpenAI weder kopieren noch zum Entwickeln konkurrierender Modelle verwenden

Modellleistung von DeepSeek und Marktreaktion

Die Veröffentlichung von DeepSeeks Reasoning-Modell R1 überraschte die Tech-Branche und Investoren
DeepSeek zieht die Aufmerksamkeit der Branche auf sich, weil das Unternehmen mit vergleichsweise geringen Kosten Modelle mit hoher Leistung aufgebaut hat
Die Nvidia-Aktie fiel am Montag um 17 %, wodurch 589 Milliarden US-Dollar an Marktkapitalisierung vernichtet wurden, legte am Dienstag jedoch wieder um 9 % zu
Grund für den Rückgang bei Nvidia waren Sorgen über eine sinkende Nachfrage nach KI-Hardware

Reaktion von OpenAI und Microsoft

OpenAI und Microsoft untersuchten im vergangenen Jahr Accounts, bei denen der Verdacht bestand, dass DeepSeek über die OpenAI-API Distillation versucht habe, und sperrten diese
Darüber berichtete zuerst Bloomberg
Microsoft wollte sich dazu nicht äußern, und auch OpenAI lehnte weitere Kommentare ab

Einschätzungen von Experten

David Sacks, in der früheren Trump-Regierung für KI und Kryptowährungen zuständig, erklärte, es könne zu einem "Diebstahl geistigen Eigentums" gekommen sein
Einige KI-Forscher analysieren, dass DeepSeeks Modell Spuren eines Trainings auf Ausgaben von GPT-4 erkennen lasse
Ritwik Gupta, Doktorand für KI an der UC Berkeley, erklärte, dass es in der KI-Branche gängige Praxis sei, Modelle anhand der Ausgaben kommerzieller LLMs zu trainieren

Reaktion von OpenAI und Ausblick

OpenAI warnte, dass mehrere Unternehmen, darunter auch aus China, versuchten, Modelle von US-KI-Unternehmen per Distillation nachzubilden
Zum Schutz des geistigen Eigentums entscheide man sorgfältig darüber, welche hochmodernen Modellfähigkeiten offengelegt werden; zudem sei die Zusammenarbeit mit der US-Regierung wichtig, um den Abfluss von Technologie zu verhindern
Allerdings sieht sich auch OpenAI selbst mit urheberrechtlichen Kontroversen konfrontiert, darunter Klagen von Medienhäusern wie der New York Times und anderen Rechteinhabern wegen des Vorwurfs unbefugter Datennutzung

2 Kommentare

botplaysdice 2025-02-01

OpenAI befindet sich in einem Rechtsstreit mit der New York Times. Wäre DeepSeek dann auf diese Weise von dieser Klage ausgenommen? :)

GN⁺ 2025-01-30

Hacker-News-Kommentare

Die Behauptung, es sei unfair, dass DeepSeek OpenAI-Daten zum Training verwendet habe, sei unangemessen, da auch OpenAI Daten aus dem Internet gesammelt und damit trainiert habe
- Die Behauptung, DeepSeek habe von Grund auf Leistung auf o1-Niveau reproduziert, könnte nicht zutreffen, was Fragen zur Trainingseffizienz aufwerfe
- Das R1-Paper von DeepSeek zeige, dass Destillation sehr leistungsfähig sei, und falls DeepSeek sein Modell mit o1-Outputs trainiert habe, könnte das Fragen zur Trainingseffizienz aufwerfen
Es gibt die Ansicht, dass DeepSeeks Open-Source-Veröffentlichung unter der MIT-Lizenz ein Anlass sein werde, große Talente anzuziehen
- Die Open-Source-Freigabe neuer Technologien habe auch in der Vergangenheit stets Fortschritt vorangetrieben
- OpenAI arbeite zum Schutz seines IP mit der US-Regierung zusammen, und es bestehe die Möglichkeit, dass DeepSeek wie TikTok verboten werde
r1 sei in einer Welt nach o1 entstanden, in der andere Modelle r1 destillieren könnten
- Es gibt die Ansicht, dass eine Destillation von o1 DeepSeeks Kostenbehauptungen nicht entkräfte
- Es stellt sich die Frage, ob OpenAI einen moralischen oder ethischen Vorsprung habe
Falls DeepSeek von OpenAI trainiert worden sei, dann sei es nicht von Grund auf für "pennies on the dollar" trainiert worden und möglicherweise kein technischer Durchbruch
- Ob das tatsächlich so ist, sei bislang nicht bestätigt
OpenAI befinde sich derzeit in einer schwachen Position und könne im Gegensatz zu Google oder Microsoft nicht auf vergleichbare juristische Ressourcen zurückgreifen
- Es gibt die Ansicht, dass eine Strategie, Konkurrenten mit Rechtsstreitigkeiten niederzuhalten, für OpenAI nicht wirksam sein werde
Ähnlich wie in der Eisenbahnindustrie könnte auch bei KI Wettbewerb die Kosten senken, während viele Investitionen am Ende womöglich keinen großen Wohlstand schaffen
- Große Unternehmen wie Nvidia, OpenAI und DeepSeek investierten in KI, könnten damit aber möglicherweise keine nennenswerten Gewinne erzielen
Kritik daran, dass OpenAI Inhalte ohne Erlaubnis genutzt und viel Geld ausgegeben habe, um Skripte zur AI-Sucht-Umgehung zu umgehen
- Falls DeepSeek OpenAI-Daten recycelt habe, sei das kein technischer Durchbruch, sondern keine ingenieurstechnische Innovation
OpenAIs Modelle seien auf E-Books trainiert worden, die in großem Umfang aus privaten Torrent-Trackern für E-Books gesammelt wurden
- Die E-Books seien ins epub-Format umgewandelt, aufbereitet und in öffentlichen Datenspeichern gehostet worden