5 Punkte von GN⁺ 2025-01-30 | 2 Kommentare | Auf WhatsApp teilen
  • OpenAI teilte der Financial Times mit, Beweise dafür gefunden zu haben, dass das chinesische KI-Startup DeepSeek seine proprietären Modelle genutzt habe, um ein konkurrierendes Open-Source-Modell zu trainieren
  • Es besteht der Verdacht, dass DeepSeek die Technik der "Knowledge Distillation" eingesetzt hat, bei der die Ausgaben großer Modelle genutzt werden, um kleinere Modelle effektiv zu trainieren
  • Distillation ist in der KI-Branche ein gängiges Verfahren, doch OpenAI argumentiert, dass DeepSeek mit dessen Hilfe ein eigenes Modell entwickelt habe und damit gegen die Nutzungsbedingungen des Unternehmens verstoßen habe
  • Laut den OpenAI-Bedingungen dürfen Nutzer die Ausgaben von OpenAI weder kopieren noch zum Entwickeln konkurrierender Modelle verwenden

Modellleistung von DeepSeek und Marktreaktion

  • Die Veröffentlichung von DeepSeeks Reasoning-Modell R1 überraschte die Tech-Branche und Investoren
  • DeepSeek zieht die Aufmerksamkeit der Branche auf sich, weil das Unternehmen mit vergleichsweise geringen Kosten Modelle mit hoher Leistung aufgebaut hat
  • Die Nvidia-Aktie fiel am Montag um 17 %, wodurch 589 Milliarden US-Dollar an Marktkapitalisierung vernichtet wurden, legte am Dienstag jedoch wieder um 9 % zu
  • Grund für den Rückgang bei Nvidia waren Sorgen über eine sinkende Nachfrage nach KI-Hardware

Reaktion von OpenAI und Microsoft

  • OpenAI und Microsoft untersuchten im vergangenen Jahr Accounts, bei denen der Verdacht bestand, dass DeepSeek über die OpenAI-API Distillation versucht habe, und sperrten diese
  • Darüber berichtete zuerst Bloomberg
  • Microsoft wollte sich dazu nicht äußern, und auch OpenAI lehnte weitere Kommentare ab

Einschätzungen von Experten

  • David Sacks, in der früheren Trump-Regierung für KI und Kryptowährungen zuständig, erklärte, es könne zu einem "Diebstahl geistigen Eigentums" gekommen sein
  • Einige KI-Forscher analysieren, dass DeepSeeks Modell Spuren eines Trainings auf Ausgaben von GPT-4 erkennen lasse
  • Ritwik Gupta, Doktorand für KI an der UC Berkeley, erklärte, dass es in der KI-Branche gängige Praxis sei, Modelle anhand der Ausgaben kommerzieller LLMs zu trainieren

Reaktion von OpenAI und Ausblick

  • OpenAI warnte, dass mehrere Unternehmen, darunter auch aus China, versuchten, Modelle von US-KI-Unternehmen per Distillation nachzubilden
  • Zum Schutz des geistigen Eigentums entscheide man sorgfältig darüber, welche hochmodernen Modellfähigkeiten offengelegt werden; zudem sei die Zusammenarbeit mit der US-Regierung wichtig, um den Abfluss von Technologie zu verhindern
  • Allerdings sieht sich auch OpenAI selbst mit urheberrechtlichen Kontroversen konfrontiert, darunter Klagen von Medienhäusern wie der New York Times und anderen Rechteinhabern wegen des Vorwurfs unbefugter Datennutzung

2 Kommentare

 
botplaysdice 2025-02-01

OpenAI befindet sich in einem Rechtsstreit mit der New York Times. Wäre DeepSeek dann auf diese Weise von dieser Klage ausgenommen? :)

 
GN⁺ 2025-01-30
Hacker-News-Kommentare
  • Die Behauptung, es sei unfair, dass DeepSeek OpenAI-Daten zum Training verwendet habe, sei unangemessen, da auch OpenAI Daten aus dem Internet gesammelt und damit trainiert habe

    • Die Behauptung, DeepSeek habe von Grund auf Leistung auf o1-Niveau reproduziert, könnte nicht zutreffen, was Fragen zur Trainingseffizienz aufwerfe
    • Das R1-Paper von DeepSeek zeige, dass Destillation sehr leistungsfähig sei, und falls DeepSeek sein Modell mit o1-Outputs trainiert habe, könnte das Fragen zur Trainingseffizienz aufwerfen
  • Es gibt die Ansicht, dass DeepSeeks Open-Source-Veröffentlichung unter der MIT-Lizenz ein Anlass sein werde, große Talente anzuziehen

    • Die Open-Source-Freigabe neuer Technologien habe auch in der Vergangenheit stets Fortschritt vorangetrieben
    • OpenAI arbeite zum Schutz seines IP mit der US-Regierung zusammen, und es bestehe die Möglichkeit, dass DeepSeek wie TikTok verboten werde
  • r1 sei in einer Welt nach o1 entstanden, in der andere Modelle r1 destillieren könnten

    • Es gibt die Ansicht, dass eine Destillation von o1 DeepSeeks Kostenbehauptungen nicht entkräfte
    • Es stellt sich die Frage, ob OpenAI einen moralischen oder ethischen Vorsprung habe
  • Falls DeepSeek von OpenAI trainiert worden sei, dann sei es nicht von Grund auf für "pennies on the dollar" trainiert worden und möglicherweise kein technischer Durchbruch

    • Ob das tatsächlich so ist, sei bislang nicht bestätigt
  • OpenAI befinde sich derzeit in einer schwachen Position und könne im Gegensatz zu Google oder Microsoft nicht auf vergleichbare juristische Ressourcen zurückgreifen

    • Es gibt die Ansicht, dass eine Strategie, Konkurrenten mit Rechtsstreitigkeiten niederzuhalten, für OpenAI nicht wirksam sein werde
  • Ähnlich wie in der Eisenbahnindustrie könnte auch bei KI Wettbewerb die Kosten senken, während viele Investitionen am Ende womöglich keinen großen Wohlstand schaffen

    • Große Unternehmen wie Nvidia, OpenAI und DeepSeek investierten in KI, könnten damit aber möglicherweise keine nennenswerten Gewinne erzielen
  • Kritik daran, dass OpenAI Inhalte ohne Erlaubnis genutzt und viel Geld ausgegeben habe, um Skripte zur AI-Sucht-Umgehung zu umgehen

    • Falls DeepSeek OpenAI-Daten recycelt habe, sei das kein technischer Durchbruch, sondern keine ingenieurstechnische Innovation
  • OpenAIs Modelle seien auf E-Books trainiert worden, die in großem Umfang aus privaten Torrent-Trackern für E-Books gesammelt wurden

    • Die E-Books seien ins epub-Format umgewandelt, aufbereitet und in öffentlichen Datenspeichern gehostet worden