5 Punkte von GN⁺ 2024-07-10 | 1 Kommentare | Auf WhatsApp teilen
  • Im November 2022 reichten Entwickler eine Sammelklage gegen GitHub, Microsoft und OpenAI ein
  • Sie behaupteten, Copilot verwende ohne Erlaubnis auf GitHub gehostete Open-Source-Software, um Code-Snippets bereitzustellen
  • Microsoft besitzt GitHub und betreibt Copilot mit generativer Machine-Learning-Technologie von OpenAI
  • Stand des Verfahrens
    • Die Klage begann zunächst mit 22 Vorwürfen, von denen die meisten abgewiesen wurden
    • In einem jüngsten Urteil wurden drei weitere Ansprüche abgewiesen, darunter Forderungen im Zusammenhang mit Abschnitt 1202(b) des DMCA
    • Verblieben sind derzeit zwei Ansprüche wegen Verstoßes gegen Open-Source-Lizenzen und Vertragsbruch
  • Urteil des Gerichts
    • Das Gericht befand, dass der von Copilot ausgegebene Code dem ursprünglichen Werk nicht hinreichend ähnlich sei
    • Außerdem urteilte es, dass Copilot beim Ausgeben von Code-Snippets keine Urheberrechtsverwaltungsinformationen entfernt habe
    • Die Ansprüche nach DMCA-Abschnitt 1202(b) wurden mangels Beweisen abgewiesen
  • Beschwerden beider Seiten
    • Die Klägerseite behauptet, die Beklagten verzögerten die Herausgabe von Unterlagen
    • Die Beklagten entgegnen, die Kläger verlangten übermäßig viele Informationen
    • OpenAI erklärte, das Verfahren für die Anforderung von E-Mails sei nicht ordnungsgemäß eingehalten worden
  • Position von GitHub
    • "Wir sind überzeugt, dass KI die Art und Weise der Softwareentwicklung revolutionieren wird, und glauben, dass Copilot die einschlägigen Gesetze einhält"
    • "Wir werden weiter investieren und verantwortungsvoll innovieren, um KI-gestützte Developer Experiences zu ermöglichen"

Zusammenfassung von GN⁺

  • Dieser Artikel behandelt den Stand der Urheberrechtsklage im Zusammenhang mit GitHub Copilot
  • Die meisten Vorwürfe, Copilot habe Open-Source-Code unrechtmäßig verwendet, wurden abgewiesen
  • Er hilft dabei, die Auswirkungen von KI auf die Softwareentwicklung und die damit verbundenen rechtlichen Fragen zu verstehen
  • Projekte mit ähnlichen Funktionen sind unter anderem Tabnine und Kite

1 Kommentare

 
GN⁺ 2024-07-10
Hacker-News-Kommentare
  • Es gibt die Ansicht, dass der Programmierassistent von GitHub Code verändert, um Urheberrechtsverletzungen zu vermeiden.
  • Es gibt die Ansicht, dass es rechtliche Probleme geben würde, wenn ein Mensch urheberrechtlich geschützten Code verändert und ihn als neuen Code ausgibt.
  • Es wird die Frage aufgeworfen, worin der Unterschied besteht, wenn eine Maschine dieselbe Arbeit erledigt.
  • Es wird behauptet, dass Copilot identischen Code erzeugen kann, aber die Klage wurde mangels Beweisen abgewiesen.
  • Einige Entwickler möchten nicht, dass ihr Code für das Training von LLMs verwendet wird.
    • Möglicherweise werden neue Lizenzen benötigt.
    • Sie könnten aufhören, zu Open Source beizutragen.
    • Es gibt die Sorge, dass Microsoft einen massiven Exodus aus der Open-Source-Entwicklung auslösen könnte.
    • Sie könnten nutzlosen Code veröffentlichen, um die Trainingsdaten zu vergiften.
  • Es gibt Unmut darüber, dass Microsoft-Mitarbeiter Slack nutzen, während Teams aufgezwungen wird.
  • Es gibt die Sorge, dass ein Sieg von MS und OpenAI dazu führen könnte, dass es legal wird, ein LLM mit geleaktem Quellcode zu trainieren.
  • Es gibt Unmut über die Formulierung „ein paar Entwickler gegen die mächtige Kraft aus Redmond“.
    • Es gibt die Ansicht, dass die kleine Seite nicht immer im Recht ist.
  • Es gibt die Ansicht, dass das Problem im Mangel an Beweisen für die Behauptung liegt, Copilot könne identischen Code erzeugen.
    • Es gibt die Ansicht, dass ein Video mit Bildschirmaufnahmen als Beweis hätte dienen können.
  • Es gibt die Ansicht, dass es verdächtig ist, dass Microsoft allen Code nutzt, den eigenen aber ausnimmt.
  • Es wird auf das Problem hingewiesen, dass Modelle im Wesentlichen darauf trainiert werden, Duplikate zu erzeugen.
    • Es gibt die Ansicht, dass die Bezeichnung als KI das Urheberrechtsproblem nicht löst.
    • Es gibt die Ansicht, dass das Training mit rechtmäßig besessenen Informationen erfolgen sollte.
  • Es wird diskutiert, ob man zu angepassten Versionen von FOSS-Lizenzen übergehen sollte, die KI-Training verbieten.
    • Mit non-ai-licenses könnte man verhindern, dass der Code in Copilots Trainingsdaten aufgenommen wird.
    • Es besteht die Absicht, solche Lizenzen im nächsten Projekt zu verwenden.