- Die Open-Source-AI-Revolution hat noch nicht stattgefunden
- Natürlich gibt es beeindruckende Open-Weight-Modelle, und denjenigen, die ihre Gewichte veröffentlichen, gebührt Dank, aber wenn man ein Modell nicht reproduzieren kann, ist es kein echtes Open Source
- Man stelle sich vor, unter Linux würde nur ein Binärpaket ohne Codebasis veröffentlicht. Oder man stelle sich vor, die Codebasis würde veröffentlicht, aber nicht der Compiler, mit dem das Binärpaket erstellt wurde. Genau das ist die heutige Situation
- Das hat mehrere Nachteile
- Man kann nicht wieder zum Projekt beitragen
- Das Projekt profitiert nicht von der OSS-Feedbackschleife
- Es ist schwer zu überprüfen, ob das Modell keine Backdoors hat (z. B. latente Agenten)
- Es lässt sich nicht überprüfen, ob Daten- und Inhaltsfilter mit den Unternehmensrichtlinien übereinstimmen
- Man ist darauf angewiesen, dass das Unternehmen das Modell aktualisiert
- Ein echtes Open-Source-LLM-Projekt, bei dem vom Codebestand bis zur Datenpipeline alles offengelegt ist, kann viel Wert und Kreativität schaffen und die Sicherheit verbessern
- Allerdings ist es nicht trivial, Gewichte zu reproduzieren, weil das nicht so einfach ist wie Code zu kompilieren. Man braucht Rechenleistung und Know-how.
- Und Beiträge zu prüfen ist schwierig, weil man ihre Auswirkungen auf die Leistung erst beim nächsten Training erkennen kann
- Aber Personen oder Gruppen mit ausreichend Motivation können diese Details herausarbeiten, und auch wenn es möglicherweise ganz anders aussieht als bestehendes OSS, sind genau diese neuen Herausforderungen der Grund, warum dieser Bereich spannend ist
3 Kommentare
Stimmt,
Deshalb wird Open Source inzwischen zu einem Mythos oder einer Urban Legend. Tatsächlich gibt es auf diesen Sites fast keine Open-Source-Modelle im eigentlichen Sinn, die sich vollständig reproduzieren lassen. Das meiste ist ein Marketing-Stunt.
Ich kann das zwar nachvollziehen, aber ... bei den Modellen, die heutzutage erscheinen, sind die für das Training nötige Rechenleistung und Zeit für normale Einzelpersonen so schwer aufzubringen, dass ich nicht genau weiß, wie das aussehen soll.
Was die Offenlegung des Datensatzes angeht, kann ich dem allerdings auch etwas zustimmen.
Hacker-News-Kommentare