- OpenAI teilte der Financial Times mit, Beweise dafür gefunden zu haben, dass das chinesische KI-Startup DeepSeek seine proprietären Modelle genutzt habe, um ein konkurrierendes Open-Source-Modell zu trainieren
- Es besteht der Verdacht, dass DeepSeek die Technik der "Knowledge Distillation" eingesetzt hat, bei der die Ausgaben großer Modelle genutzt werden, um kleinere Modelle effektiv zu trainieren
- Distillation ist in der KI-Branche ein gängiges Verfahren, doch OpenAI argumentiert, dass DeepSeek mit dessen Hilfe ein eigenes Modell entwickelt habe und damit gegen die Nutzungsbedingungen des Unternehmens verstoßen habe
- Laut den OpenAI-Bedingungen dürfen Nutzer die Ausgaben von OpenAI weder kopieren noch zum Entwickeln konkurrierender Modelle verwenden
Modellleistung von DeepSeek und Marktreaktion
- Die Veröffentlichung von DeepSeeks Reasoning-Modell R1 überraschte die Tech-Branche und Investoren
- DeepSeek zieht die Aufmerksamkeit der Branche auf sich, weil das Unternehmen mit vergleichsweise geringen Kosten Modelle mit hoher Leistung aufgebaut hat
- Die Nvidia-Aktie fiel am Montag um 17 %, wodurch 589 Milliarden US-Dollar an Marktkapitalisierung vernichtet wurden, legte am Dienstag jedoch wieder um 9 % zu
- Grund für den Rückgang bei Nvidia waren Sorgen über eine sinkende Nachfrage nach KI-Hardware
Reaktion von OpenAI und Microsoft
- OpenAI und Microsoft untersuchten im vergangenen Jahr Accounts, bei denen der Verdacht bestand, dass DeepSeek über die OpenAI-API Distillation versucht habe, und sperrten diese
- Darüber berichtete zuerst Bloomberg
- Microsoft wollte sich dazu nicht äußern, und auch OpenAI lehnte weitere Kommentare ab
Einschätzungen von Experten
- David Sacks, in der früheren Trump-Regierung für KI und Kryptowährungen zuständig, erklärte, es könne zu einem "Diebstahl geistigen Eigentums" gekommen sein
- Einige KI-Forscher analysieren, dass DeepSeeks Modell Spuren eines Trainings auf Ausgaben von GPT-4 erkennen lasse
- Ritwik Gupta, Doktorand für KI an der UC Berkeley, erklärte, dass es in der KI-Branche gängige Praxis sei, Modelle anhand der Ausgaben kommerzieller LLMs zu trainieren
Reaktion von OpenAI und Ausblick
- OpenAI warnte, dass mehrere Unternehmen, darunter auch aus China, versuchten, Modelle von US-KI-Unternehmen per Distillation nachzubilden
- Zum Schutz des geistigen Eigentums entscheide man sorgfältig darüber, welche hochmodernen Modellfähigkeiten offengelegt werden; zudem sei die Zusammenarbeit mit der US-Regierung wichtig, um den Abfluss von Technologie zu verhindern
- Allerdings sieht sich auch OpenAI selbst mit urheberrechtlichen Kontroversen konfrontiert, darunter Klagen von Medienhäusern wie der New York Times und anderen Rechteinhabern wegen des Vorwurfs unbefugter Datennutzung
2 Kommentare
OpenAI befindet sich in einem Rechtsstreit mit der New York Times. Wäre DeepSeek dann auf diese Weise von dieser Klage ausgenommen? :)
Hacker-News-Kommentare
Die Behauptung, es sei unfair, dass DeepSeek OpenAI-Daten zum Training verwendet habe, sei unangemessen, da auch OpenAI Daten aus dem Internet gesammelt und damit trainiert habe
Es gibt die Ansicht, dass DeepSeeks Open-Source-Veröffentlichung unter der MIT-Lizenz ein Anlass sein werde, große Talente anzuziehen
r1 sei in einer Welt nach o1 entstanden, in der andere Modelle r1 destillieren könnten
Falls DeepSeek von OpenAI trainiert worden sei, dann sei es nicht von Grund auf für "pennies on the dollar" trainiert worden und möglicherweise kein technischer Durchbruch
OpenAI befinde sich derzeit in einer schwachen Position und könne im Gegensatz zu Google oder Microsoft nicht auf vergleichbare juristische Ressourcen zurückgreifen
Ähnlich wie in der Eisenbahnindustrie könnte auch bei KI Wettbewerb die Kosten senken, während viele Investitionen am Ende womöglich keinen großen Wohlstand schaffen
Kritik daran, dass OpenAI Inhalte ohne Erlaubnis genutzt und viel Geld ausgegeben habe, um Skripte zur AI-Sucht-Umgehung zu umgehen
OpenAIs Modelle seien auf E-Books trainiert worden, die in großem Umfang aus privaten Torrent-Trackern für E-Books gesammelt wurden