10 Punkte von GN⁺ 2024-10-28 | 2 Kommentare | Auf WhatsApp teilen
  • Facebook-CEO Mark Zuckerberg behauptet, Metas Large Language Model Llama 3 sei Open Source, tatsächlich ist es das aber nicht
  • Laut der Open-Source-Definition der Open Source Initiative (OSI) erfüllt die Lizenz von Llama 3 die Open-Source-Kriterien in mehreren Punkten nicht
  • Meta ist nicht das einzige Unternehmen, das zu solchen Tricks greift. Das wird als „Open Washing“ bezeichnet
    • Open Washing ist eine irreführende Praxis, bei der Produkte oder Services, die in Wirklichkeit nicht offen sind, als „offen“ vermarktet werden
    • Der Begriff wurde 2009 von der Internetpolitik-Forscherin Michelle Thorne geprägt, inspiriert von „Greenwashing“
  • Im AI-Bereich ist Open Washing weit verbreitet. Von 45 Modellen, die Forschende der Radboud University untersucht haben, sind die Modelle großer Unternehmen wie Google, Meta und Microsoft in Wirklichkeit nicht Open Source

Warum Unternehmen Open Washing betreiben

  • Früher standen Unternehmen Open Source eher ablehnend gegenüber, heute hat sich die Wahrnehmung zum Positiven gewandelt
    • 2001 erklärte Steve Ballmer: „Linux ist Krebs“ und behauptete, wer Open-Source-Software nutze, müsse auch den Rest seiner Software zu Open Source machen
  • Unternehmen nutzen das positive Image von Open Source, ohne sich tatsächlich zu Open Source zu bekennen
    • Das hilft ihnen, ihr öffentliches Image zu verbessern und Verbraucher anzusprechen, die Transparenz und Offenheit schätzen
    • Einige Unternehmen nutzen Open Washing, um ihre Modelle und Praktiken vor wissenschaftlicher und regulatorischer Kontrolle zu schützen und zugleich von dem Label „offen“ zu profitieren
    • Der EU AI Act gewährt „Open-Source“-Modellen besondere Ausnahmen und schafft damit einen starken Anreiz für Open Washing

Fehlende klare Definition von Open-Source-AI

  • Die EU hat bislang noch keine klare Definition für Open-Source-AI festgelegt – tatsächlich hat das bisher niemand geschafft
    • Die OSI will in den kommenden Tagen eine Definition für Open-Source-AI veröffentlichen
    • Die derzeitigen Open-Washing-Lizenzen verfehlen die Definitionen aller – außer der ihrer Urheber
  • Aber nicht alle großen AI-Unternehmen täuschen bei Open Source
    • Das Granite 3.0 LLM von IBM wird zum Beispiel tatsächlich als Open Source unter der Apache-2-Lizenz bereitgestellt
  • Obwohl die OSI keine Regierung oder Regulierungsbehörde ist: Warum ist es wichtig, den Begriff Open Source korrekt zu verwenden?
    • Die OSI ist lediglich eine Non-Profit-Organisation, die nützliche Leitlinien erstellt hat
  • Dan Lorenc, CEO von Chainguard, sagte dazu kürzlich in seiner Keynote auf der SOSS-Konferenz in Atlanta:
    • Niemand kann andere zwingen, die Definition der OSI zu verwenden, aber viele Menschen – insbesondere Juristen – vertrauen auf diese Definition
    • Sie vertrauen der Arbeit der OSI und verstehen den Schutz, den Unternehmen erhalten, wenn sie Lizenzen verwenden, die den Open-Source-Kriterien entsprechen
    • Deshalb taucht diese Definition in Beschaffungsverträgen großer Unternehmen auf der ganzen Welt auf

Open Source ist nicht nur eine rechtliche oder geschäftliche Frage

  • Open Source gibt Entwicklern die Freiheit, ungehindert zu arbeiten
    • Ohne Open Source ginge der Vorteil verloren, Code frei nutzen zu können, ohne die vielen Bedingungen einzelner Lizenzen genau kennen oder beachten zu müssen
    • Wenn jede einzelne Code-Lizenz geprüft werden müsste, müssten Entwickler jedes Mal eine juristische Prüfung veranlassen, wenn sie eine neue Library einsetzen
    • Unternehmen würden davor zurückschrecken, überhaupt etwas im Internet zu veröffentlichen, wenn unklar wäre, welche Haftung sie bei offen gelegtem Source Code trifft
  • Lorenc betonte, dass das kein Problem nur der Großunternehmen ist, sondern ein gemeinsames Problem
    • Alle, die Open Source nutzen, wären davon betroffen
    • Ganze Projekte könnten aufhören zu funktionieren, Sicherheitslücken würden nicht behoben und Wartung würde deutlich schwieriger
    • Wir müssen gemeinsam handeln, um die Definition von Open Source zu bewahren und zu verteidigen. Sonst mischen sich wieder die Juristen ein
  • Viele IP-Anwälte wollen sich mit genau solchen mühsamen Problemen gar nicht befassen
    • Echte Open-Source-Lizenzen machen das Leben von Unternehmen, Programmierern und Juristen gleichermaßen leichter
    • Klauseln wie „offen – außer für diejenigen, die mit uns konkurrieren könnten“ oder „offen – außer für diejenigen, die den Code in der Cloud bereitstellen könnten“ laden Probleme geradezu ein

Open Washing schadet allen

  • Letztlich wird Open Washing die juristische, geschäftliche und entwicklungsbezogene Arbeit aller vergiften
  • Ironischerweise werden auch die kurzsichtigen Unternehmen darunter leiden, die diesen Ansatz heute unterstützen
  • Denn am Ende basiert fast ihre gesamte Arbeit – insbesondere im AI-Bereich – auf Open Source

Meinung von GN⁺

  • Open-Washing-Praktiken, die die Definition von Open Source aushöhlen, können sich nicht nur im AI-Bereich, sondern in der gesamten Softwareindustrie negativ auswirken. Sie schränken Entwickler ein und erhöhen die rechtlichen Risiken für Unternehmen
  • Dass Unternehmen nur das positive Image von Open Source nutzen wollen, ist kurzsichtig. Langfristig kann es ihnen selbst schaden
  • Für den Fortschritt der AI-Technologie sind Zusammenarbeit und Wissensaustausch im Geist von Open Source unverzichtbar. Unternehmen sollten beim Aufbau einer echten Open-Source-Kultur vorangehen
  • Eine klare Definition und klare Standards für Open-Source-AI sind dringend nötig. Die Open-Source-AI-Definition der OSI soll in Kürze veröffentlicht werden; darauf aufbauend sollten Unternehmen, Regierungen und die Entwickler-Community zusammenarbeiten
  • Es braucht außerdem mehr Aufklärung für Verbraucher und Entwickler, um Open Washing vorzubeugen. Wichtig ist die Gewohnheit, Behauptungen von Unternehmen über „Offenheit“ nicht einfach hinzunehmen, sondern Lizenzen und tatsächliche Praktiken sorgfältig zu prüfen

2 Kommentare

 
ndrgrd 2024-10-28

Es kommt offenbar häufig vor, dass Unternehmen ein Projekt als Open Source veröffentlichen, die anfänglichen Bugfixes und Funktionsverbesserungen der Community überlassen und es dann, sobald es stabilisiert ist, wieder stillschweigend unter eine proprietäre Lizenz ziehen.

Manche sagen zwar, man könne es ja einfach forken, aber am Ende kassiert das Unternehmen einfach das bereits etablierte Image und den Markenwert.

 
GN⁺ 2024-10-28
Hacker-News-Kommentare
  • Bei der Wahl zwischen zwei Programmen oder AI-Modellen entsteht eine Debatte zwischen Menschen, die Open Source bevorzugen, und solchen, die das nicht tun. Das Ziel ist, auch nicht Open-Source-Programme so erscheinen zu lassen, als seien sie Open Source.

  • Open Source war ein unternehmensfreundlicher Kompromiss, aber einige Beteiligte hatten hohe moralische Ansprüche. Menschen mit dieser Haltung sollten den Missbrauch von Open Source verhindern.

  • Wenn sich das nicht über Marken, Zertifizierungen oder Lizenzen lösen lässt, muss die Botschaft über Mainstream-Medien verbreitet werden. <i>The Register</i> verfügt über internes Wissen, aber es muss einer breiten Öffentlichkeit bekannt werden.

  • Viele Unternehmen schimpfen auf Open Source und betreiben ihr Geschäft dennoch auf Basis von Open-Source-Software wie Linux, Java und Debian. Die meisten Unternehmen fühlen sich nicht verpflichtet, etwas beizutragen oder Unterstützung zu leisten.

  • Die OSI arbeitet an einer umstrittenen Definition von Open Source AI.

  • thirdweb ist technisch gesehen Open Source, funktioniert aber ohne API-Key nicht und prüft im SAAS die API-Call-Limits. Das entmutigt Teams, die eine echte Open-Source-Alternative schaffen wollen.

  • Dass sich Konzepte wie Fair Source nicht durchsetzen konnten, hat dazu geführt, dass kleine Nicht-SaaS-Unternehmen mit Open Source nicht überleben können.

  • Open Source besitzt nicht die Ethik oder Philosophie Freier Software. Freie Software ist Open Source überlegen.

  • Bei großen Modellen sind die Trainingskosten hoch, binäre Artefakte wertvoll und anpassbar. Wenn die OSI eine Definition festlegt, ist ihre Arbeit lobenswert, unabhängig davon, ob Meta sich daran hält.

  • Die OSI muss erkennen, dass im Zeitalter großer Cloud-Anbieter Schutz vor Marktteilnehmern nötig ist. Es braucht klare Lizenzoptionen, um Dramen wie bei Mongo, Elastic und Redis zu vermeiden.

  • Der Begriff "Open <something>" sollte geschützt werden, damit die Öffentlichkeit nicht irregeführt wird. Verwirrung wie bei "OpenAI" muss verhindert werden.

  • Es ist noch schlimmer, nach Annahme von Community-Beiträgen die Lizenz zurückzuziehen, als den Begriff "Open Source" falsch zu verwenden. Das sollte als Betrug gelten und zivilrechtliche Haftung nach sich ziehen.

  • Für AI-Modelle ist die Bezeichnung "Open Weights" passender, wenn keine reproduzierbaren Trainingsskripte und Daten geteilt werden.