5 Punkte von GN⁺ 2024-05-10 | 1 Kommentare | Auf WhatsApp teilen

Gegenreaktionen der Nutzer auf die Ankündigung der Partnerschaft zwischen Stack Overflow und OpenAI

  • Einige Nutzer reagieren ablehnend auf die kürzlich angekündigte Partnerschaft zwischen Stack Overflow und OpenAI
  • Einige Nutzer versuchten, ihre Inhalte (Fragen und Antworten) auf Stack Overflow zu löschen, hatten jedoch Schwierigkeiten, da sich dies auf der Website nicht ohne Weiteres umsetzen lässt
  • Daraufhin beschlossen diese Nutzer, aus Protest gegen die Zusammenarbeit zwischen Stack Overflow und OpenAI ihre Fragen oder Antworten durch Bearbeitungen zu "verunstalten"

Überblick über die Partnerschaft zwischen Stack Overflow und OpenAI

  • Stack Overflow und OpenAI haben eine Zusammenarbeit über eine neue API-Partnerschaft angekündigt
  • Ziel dieser Zusammenarbeit ist es, die umfangreiche Wissensplattform von Stack Overflow mit den fortschrittlichen KI-Modellen von OpenAI zu verbinden und Entwicklern bereitzustellen
  • Nutzer von OpenAI sollen über den Zugriff auf die OverflowAPI die präzisen und verifizierten Daten von Stack Overflow nutzen können, um Probleme schneller zu lösen und sich auf priorisierte Aufgaben zu konzentrieren
  • Außerdem will OpenAI das verifizierte technische Wissen von Stack Overflow in ChatGPT integrieren, um den Zugang der Nutzer zu vertrauenswürdigen Informationen und Code zu verbessern

Gegenreaktionen auf KI

  • Websites von Stack Overflow und anderen Stack-Exchange-Angeboten sind für die Community sehr nützliche Werkzeuge, doch einige Nutzer sind wenig erfreut darüber, dass ihre Inhalte für das Training von KI verwendet werden und anschließend zur Beantwortung ohne Quellenangabe dienen
  • Das ist heute nicht nur bei Stack Overflow zu beobachten, sondern eine häufige Reaktion von Content-Erstellern im gesamten Internet
  • Das Internet befindet sich derzeit in einer Phase des Wandels: weniger Blog-Traffic und Page Views, mehr Antworten-Suche mithilfe von KI und bei manchen Menschen eine geringere Nutzung von Suchmaschinen
  • Es ist eine Phase der Spannung, in der sich die Anpassung an neue Fähigkeiten von ChatGPT und anderen LLMs (Large Language Models) mit Unsicherheit darüber verbindet, was all das für das Internet bedeutet, wie wir es kennen
  • Die jüngste Gegenreaktion auf die Partnerschaft zwischen Stack Overflow und OpenAI ist nur ein Beispiel dafür, wie Menschen negativ auf die breite Einführung von KI und die daraus resultierenden schnellen Veränderungen reagieren

Sperrt Stack Overflow Konten wegen der Entfernung von Inhalten?

  • Mehrere Nutzer berichteten auf Twitter und Hacker News, dass sie nach dem Versuch, mehrere zuvor auf Stack Overflow veröffentlichte Fragen und Antworten zu löschen, E-Mails von Moderatoren von Stack Overflow erhalten hätten, in denen von einer siebentägigen Aussetzung oder einer vorübergehenden Sperre ihres Kontos die Rede war
  • Laut den E-Mails des Moderationsteams von Stack Overflow kann das Löschen oder Entfernen von Inhalten, die für andere nützlich sein könnten, Verwirrung in der gesamten Community stiften. Das gilt auch dann, wenn diese Inhalte für den Autor selbst nicht mehr nützlich sind
  • Da das Geschäft von Stack Overflow und das gesamte Stack-Exchange-Netzwerk auf nutzergenerierte Inhalte angewiesen sind, damit die Websites ihren Nutzen behalten, liegen die wirtschaftlichen Gründe dafür, dass Nutzer Inhalte nicht massenhaft entfernen sollen, auf der Hand
  • Dass Stack Overflow Konten aussetzt und Warn-E-Mails verschickt, ist wahrscheinlich nichts Neues. Vermutlich werden solche Richtlinien schon lange zum Schutz der Plattform angewendet
  • Wenn Nutzer große Mengen an Inhalten leicht verunstalten oder löschen könnten, könnte das die Plattform erheblich stören; daher liegt der Schutz der Inhalte im besten Interesse von Stack Overflow und der Community
  • Außerdem handelt es sich dabei wahrscheinlich um automatisierte E-Mails, die durch das Verhalten der Nutzer ausgelöst wurden, und es wäre sinnvoll, Stack Overflow bezüglich der Inhalte direkt zu kontaktieren
  • Bislang gab es offenbar keine Stellungnahme von Stack Overflow zu diesen Kontosperren. Auch ist unklar, wie viele Nutzer dies tatsächlich versuchen, sodass es möglicherweise keinen großen Widerstand gegen die Partnerschaft zwischen Stack Overflow und OpenAI gibt
  • Da die Dynamik bei der Einführung von KI vorerst kaum nachlassen dürfte, bleibt spannend zu beobachten, wie sich all das weiterentwickelt
  • Den übrigen Stack-Overflow-Nutzern wird nicht empfohlen, ihre Inhalte als Zeichen des Protests zu löschen

Meinung von GN⁺

  • Die Partnerschaft zwischen Stack Overflow und OpenAI dürfte die Entwicklung der KI-Technologie und die Entwickler-Community stark beeinflussen. Wie jedoch das Gleichgewicht zwischen dem Schutz des geistigen Eigentums einzelner Entwickler und der Nutzung als KI-Trainingsdaten hergestellt werden kann, bleibt eine offene Frage
  • Entwickler sollten ihr Wissen teilen können und dafür zugleich eine angemessene Vergütung erhalten. Stack Overflow scheint dafür ein geeignetes Vergütungssystem schaffen zu müssen
  • Damit Entwickler freiwillig Wissen teilen, ist Vertrauen in die Community sehr wichtig. Nach diesem Vorfall scheint ein vorsichtiger Ansatz nötig, damit das Vertrauen der Entwickler in Stack Overflow nicht beschädigt wird
  • Andererseits bringt die Verbesserung der Entwicklungsproduktivität durch KI-Technologien wie ChatGPT auch für Entwickler große Vorteile. Es gilt, Wege zu finden, die Vorteile zu maximieren und zugleich Nebenwirkungen wie Datenschutzprobleme zu minimieren
  • Ein ähnliches Thema gab es bereits bei den Urheberrechtskontroversen rund um GitHub Copilot. Es scheint nötig, innerhalb der Entwickler-Community intensiv zu diskutieren und einen Konsens zu finden, den alle akzeptieren können

1 Kommentare

 
GN⁺ 2024-05-10
Hacker-News-Kommentare
  • Problem der Änderung der Lizenz für von Nutzern erstellte Inhalte bei StackOverflow:
    • Vor etwa fünf Jahren erklärte StackOverflow fälschlicherweise, dass alle von Nutzern eingereichten Inhalte unter CC-BY-SA 4.0 bereitgestellt würden. Die ursprüngliche Nutzervereinbarung war CC-BY-SA 3.0.
    • Von Mitte 2018 bis Anfang 2019 herrschte Verwirrung über die für Code und Nicht-Code geltenden Lizenzen.
    • Anfang 2019 wurden die Nutzer aufgefordert, sich erneut einzuloggen und einer neuen Lizenzvereinbarung zuzustimmen.
    • Derzeit gilt für Inhalte vor dem 5. Mai 2018 CC-BY-SA 3.0, danach CC-BY-SA 4.0.
  • Meinungen der Nutzer zu KI-Scrapern bei StackOverflow und zur Bereitstellung für OpenAI:
    • Manche Nutzer haben kein Problem damit, dass ihre Antworten für KI-Training verwendet werden. Sie sehen darin einen großen Mehrwert für Tools wie ChatGPT.
    • Die OpenAI-Partnerschaft ist nicht der Kern des Problems rund um das Löschen von Nutzerinhalten. Das Löschen von Inhalten war lizenzbedingt ohnehin nicht gern gesehen und wurde meist rückgängig gemacht.
    • Wegen der CC-BY-SA-Lizenz können andere die Inhalte kopieren, auch wenn StackOverflow es nicht erlaubt, sodass das Löschen von Inhalten schwierig ist.
    • Nutzer können ihren Namen entfernen oder persönliche Informationen bearbeiten, aber hochwertige Inhalte selbst können später nicht entfernt werden.
  • Problem dabei, dass gewinnorientierte Unternehmen „kostenlose“ Produkte verwalten:
    • Sie müssen Geld verdienen und sind daher nicht an Open-Source-Ethik gebunden. Nutzer glauben, sie würden zu Open Source beitragen, tatsächlich ist das aber nicht so.
    • Das Verhalten von StackExchange ist wahrscheinlich legal, aber die Beitragenden sind keine Stakeholder, und es reicht aus, nur so viele Beitragende zu halten, wie es kommerziell tragfähig ist.
    • Bei kostenlos angebotenen Produkten werden die Nutzer selbst zum Produkt, und wenn man nicht weiß, wie monetarisiert wird, wird man irgendwann enttäuscht werden.
  • Notwendigkeit neuer Inhaltslizenzen speziell für KI-Training:
    • Es könnte Lizenzen im Geist der GPL geben, die etwa verlangen, bei Inhalten, die für kommerzielles KI-Training verwendet wurden, die KI-Gewichte offenzulegen.
  • Das Modell von StackOverflow, Datensätze zu verkaufen:
    • StackOverflow hat sich von Anfang an eher auf den Aufbau eines Datensatzes für SEO als auf Nutzerzentrierung konzentriert. Durch den OpenAI-Deal hat sich daran nicht viel geändert.
    • Mit dem Aufkommen von LLMs ist die Krise von StackOverflow unvermeidlich, daher ist es besser, vor dem Zusammenbruch noch mitzunehmen, was man durch den Verkauf an OpenAI bekommen kann.
  • Bedeutung der ShareAlike-Klausel in der CC BY-SA-Lizenz:
    • Die Klausel, dass Derivate unter derselben Lizenz verbreitet werden müssen, ist sehr weitreichend und mehrdeutig. Die Definition von "build upon" könnte für viele Nutzer wenig attraktiv sein.
  • Vergleich der Vor- und Nachteile von LLMs und StackOverflow:
    • Dank LLMs kann man StackOverflow möglichst vermeiden. StackOverflow ist voller Elitismus und einer toxischen Kultur, die Verfahren wichtiger nimmt als tatsächliche Hilfe.
    • Es gibt Beschwerden darüber, dass LLMs manchmal falsche Antworten geben, aber auch unter den Antworten auf StackOverflow gibt es viele, die völlig falsch sind oder nichts mit der Frage zu tun haben. Außerdem sind viele Antworten veraltet.
    • Die ideale Lösung wäre eine Kombination aus den Schreibfähigkeiten von LLMs und der Verifizierung durch StackOverflow-Nutzer. Für Leute, deren einziges Ziel das Sammeln von Internetpunkten ist, wäre das vielleicht nicht gut, für die Nutzer aber optimal.
  • Automatische Warnmeldung von StackOverflow bei massenhaftem Löschen von Inhalten:
    • Sie scheint es mindestens seit 2017 zu geben und wird offenbar automatisch angezeigt, wenn Massenlöschungen erkannt werden.
    • Da StackOverflow eher wikiartig als ein Forum ist, ist der Grund für diese Richtlinie nachvollziehbar. Sie scheint nicht eingeführt worden zu sein, um Proteste gegen OpenAI zu beschwichtigen.
  • Es gibt auch die persönliche Einschätzung, StackOverflow in den vergangenen zwei Jahren kaum noch genutzt zu haben.