1 Punkte von GN⁺ 2 시간 전 | 1 Kommentare | Auf WhatsApp teilen
  • Commit-Messages sind ein Ort für technische Informationen, und Formulierungen wie „Assisted by blabot“ werden zu Werbung, die den Namen eines Tools oder Unternehmens sichtbar macht
  • Es ist problematisch, dass Nutzer, die ein Abo bezahlen, Werbesätze in Commits einfügen, obwohl Open-Source-Projekte von diesen Unternehmen kein Geld erhalten
  • Ob ein AI-Tool verwendet wurde, kann bei Bedarf im Merge Request offengelegt werden; im Commit ist ein allgemeiner Ausdruck wie „generated by an LLM“ angemessener
  • Tools, die automatisch Werbeformulierungen in Commits, E-Mails oder andere Nachrichten einfügen, sind schlechte Tools; der Kern des Problems ist weniger die Tool-Nutzung als die Verschmutzung von Metadaten
  • Auch Formate wie „Co-authored-by“ werden zu kostenlosem Werbeplatz, wenn sie über technische Kollaborationsinformationen hinaus bestimmte Bots oder Services sichtbar machen

Commit-Messages sollten ein Ort für technische Informationen sein

  • Wenn man in Commit-Messages Formulierungen wie „Assisted by blabot“, „co-authored-by: slopgpt“ oder „sent from my fartphone“ einfügt, wird daraus Werbung, die den Namen eines Unternehmens oder Tools sichtbar macht
  • Problematisch ist die Struktur, in der Nutzer mit kostenpflichtigem Abo Werbetexte für Unternehmen in Commits platzieren, obwohl Open-Source-Projekte von diesen Unternehmen nicht bezahlt werden
  • Es entsteht der Widerspruch, Werbeblocker zu nutzen und gleichzeitig Werbung in Commits einzufügen
  • Commits sind ein Ort für technische Informationen und sollten kein Werberaum für bestimmte Tools oder Unternehmen sein

Wie die Nutzung von AI-Tools offengelegt werden sollte

  • Falls nötig, kann die Nutzung von AI-Tools im Merge Request offengelegt werden
  • Im Commit ist es angemessener, statt eines konkreten Unternehmens- oder Produktnamens eine allgemeine Formulierung wie „generated by an LLM“ zu hinterlassen
  • Einen konkreten Unternehmensnamen in einen Commit zu schreiben, bedeutet, kostenlosen Werbeplatz bereitzustellen
  • Man kann sich auch einfach dafür entscheiden, solche Tools gar nicht zu verwenden

Maßstäbe für Tools

  • Tools, die automatisch Werbeformulierungen in Commits, E-Mails oder andere Nachrichten einfügen, kann man als schlechte Tools betrachten
  • Der Kern des Problems liegt weniger darin, ob ein Tool verwendet wurde, sondern darin, dass Werbeformulierungen von Unternehmen in Metadaten oder Nachrichten des erzeugten Ergebnisses hineingelangen
  • Auch Formate wie „Co-authored-by“ werden zu Werbung, wenn sie über technische Kollaborationsinformationen hinaus dafür genutzt werden, bestimmte Bots oder Services sichtbar zu machen

Verwandte Position

1 Kommentare

 
GN⁺ 2 시간 전
Lobste.rs-Meinungen
  • Es stimmt schon, dass Tools, die Werbung an Nachrichten wie Commits oder E-Mails anhängen, wirklich schlechte Tools sind, aber die Lösung ist nicht, es schwerer zu machen, die Nutzung solcher schlechten Tools zu entdecken, sondern solche Tools gar nicht erst zu benutzen
    Persönlich bin ich sogar ein wenig dankbar dafür, dass Leute, die so etwas tun, sich damit selbst verraten wollen

    • Stimme zu, aber es wäre gut, einmal innezuhalten und darüber nachzudenken, warum Leute plötzlich glauben, dass so ein Verhalten erlaubt ist
      Die eigentliche Lösung ist letztlich, keine Tools zu verwenden, die Werbung in Arbeitsergebnisse einfügen
  • Vielen Menschen ist es wichtig, von LLM generierten Code zu vermeiden, daher halte ich es nicht für richtig, Offenlegung über LLM-Nutzung zu verringern
    Wenn diese Information in der Commit-Nachricht steht, ist es auch leicht, mit Tools wie slopcheck automatisch festzustellen, ob eine Codebasis LLM-generierten Code enthält
    Wichtig ist aber nicht, welches LLM verwendet wurde, sondern die Tatsache, dass überhaupt ein LLM verwendet wurde. Wenn Nutzer solcher Tools auf diese Form umstellen, könnte man den Schaden durch Werbung für bestimmte Produkte verringern und trotzdem das Offenlegungsbedürfnis erfüllen

    • Genau. Wenn es einfach nur etwas wie „das wurde von einem LLM erzeugt“ wäre, wäre das vielleicht in Ordnung, aber gerade machen die Leute für diese Firmen kostenlos Werbung
  • Ich verstehe vollkommen, was gemeint ist, sehe einen Punkt aber etwas anders
    Ich hasse es wirklich, wie AI-Firmen völlig kostenlose Werbung bekommen und wie sie auf diese Weise in Open-Source-Software eindringen
    Ich bin aber dagegen, die Offenlegung nur in Merge Requests zu machen. Nicht alle sehen sich Merge Requests an, und wenn ich wissen will, ob ich diesem Commit vertrauen kann, sollte ich mich auf nichts anderes als die git-Historie verlassen müssen

    • Wenn ein Tool wie bei Protobuf deterministisch Code erzeugt, ist es nützlich, den Tool-Namen im Code zu haben, für Debugging und Upgrades
      Aber bei LLM-generiertem Code sehe ich den Sinn nicht wirklich. Dass ein Tool wie Dependabot Commits signiert, ist in Ordnung. Das ist nützliche Information, um Probleme zu beheben und Wiederholungen zu verhindern, wenn etwas schiefgeht
  • Wie wäre es dann mit so etwas wie „Proudly typed in nano“? :D

    • „edited with sed - the modern stream editor for filtering and transforming text”
    • „Sent from my iPhone”
    • Weil ich manchmal mit meinen Haustier-Eidechsen spreche, um Probleme zu verstehen, denke ich oft darüber nach, assisted-by: my pet lizards hinzuzufügen
    • Moment mal! Manche FOSS-Projekte wollen bereits nano-Nutzer ausschließen. Damit würdest du gerade eine Möglichkeit vorschlagen, das zu ermöglichen
    • Das ist unnötig. Jeder weiß, dass ed(1) der Standard-Texteditor ist, also ist das implizit und verschwendet nur Bytes
  • Ich wäre ziemlich wütend, wenn Visual Studio anfangen würde, „Made using Visual Studio” an meine Commits anzuhängen

    Sent using
    Firefox 140.10.2esr (64-bit)
    Debian GNU/Linux 13 (trixie) x86_64
    Linux 6.12.86+deb13-amd64
    Using locally sourced electricity from free range waterfalls

    • Wenn LLMs immer stärker integriert werden, sehen wir vielleicht irgendwann auch so etwas:
      Method names suggested by Microsoft IntelliSense (R) and Pyright (TM)\
      Grammar and spelling corrections by Apple Intelligence (R)
  • Vielleicht aus demselben Grund, aus dem Leute T-Shirts mit „Nike” oder „Adidas” darauf tragen

    • Ich habe nie verstanden, dass Leute so etwas bereitwillig, ja sogar eifrig tun
    • Als ich meinen Großvater fragte, warum er überhaupt keine Kleidung mit Logos trage, antwortete er sinngemäß: „Wenn jemand will, dass ich Werbung für ihn mache, soll er mich dafür bezahlen“
    • Solche Kleidung habe ich auch nie verstanden. Sie ist nicht einmal schön
    • Ich trage gerade ein T-Shirt mit der Aufschrift „London Perl Workshop 2017“ und stelle fest, dass ich keinerlei konkrete Erinnerung an die Veranstaltung in diesem Jahr habe
      Vielleicht wäre Sportkleidung doch besser
  • Wenn ich mit jemandem Pair Programming mache und dann committe, steht der Name dieser Person unter co-authored-by
    Ich finde, der Beitrag eines LLM beim Programmieren ist groß genug, um im Commit anerkannt zu werden. Ich committe den Code und trage die Verantwortung dafür, aber ich bin nicht die einzige Autorin oder der einzige Autor dieses Codes

    • Das ist keine echte Person, sondern einfach nur Werbung für eine Firma
    • Ich sehe nicht, worin sich der Beitrag eines LLM vom Beitrag von vim, IDE-Autovervollständigung oder Google-Suchergebnissen unterscheidet
      Trotzdem habe ich noch nie jemanden gesehen, der es eilig gehabt hätte, in einen Commit zu schreiben: „Ich habe beim Schreiben Google konsultiert und in xcode viermal Tab-Vervollständigung benutzt“
    • Ich bin nicht sicher, ob das genau den aktuellen Punkt trifft
      Man kann ein Spring-Projekt bootstrappen, in Go etwas mit echo oder der cobra CLI erzeugen oder Laravel-Boilerplate erstellen. Es gibt Generatoren in vielen Sprachen
      Trotzdem fügt man nicht „co-authored by X tool“ hinzu
      Es ist nicht völlig dasselbe, das ist mir klar, aber ähnlich genug. Man fügt dem Changeset Tool-Metadaten hinzu. Das ist nicht nötig. Man sollte die relevanten geschäftlichen Konzepte eintragen und Hinweise zu technischen Entscheidungen geben
      Es gibt keinen Grund, das Tool zu erwähnen
  • Ich weiß nicht, ob der Webserver überlastet ist, falsch konfiguriert wurde oder mich als Bot eingestuft hat, aber ich muss etwa 30 Sekunden auf die HTTPS-Verbindung warten

  • Ich halte es eher für ein gutes Signal. Eine gute Möglichkeit zu sehen, wie viel Mühe oder auch wie wenig Mühe in den Code geflossen ist

  • Ich bin sehr gegen Werbung, aber nicht deshalb, weil ich hoffe, dass niemand Verbraucherprodukte kennt oder benutzt
    Sondern weil ich möchte, dass Menschen korrekte und unverzerrte Informationen über Verbraucherprodukte erhalten
    Ich finde nicht, dass das Einfügen dieser Information in Commits Verzerrung erzeugt. Ob Claude, Copilot oder was auch immer an diesem Commit beteiligt war, ist eindeutig eine Tatsache, und viele Menschen haben in diesem Kontext ein berechtigtes Interesse daran, das zu wissen. Ob der Committer Emacs benutzt hat, ist dagegen keine Information von Interesse. Das steht nicht grundlos drin
    Wenn es dir nicht gefällt, kannst du deinen User-Agent so einstellen, dass er das nicht ausgibt

    • Aber andere Metadaten und Tool-Informationen fügt man auch nicht hinzu. Zum Beispiel schreibt man in Commits auch nicht hinein, dass Emacs verwendet wurde