KI zerstört Open Source, obwohl sie noch nicht einmal richtig funktioniert
(jeffgeerling.com)- Nachdem eine Code-Zusammenführung abgelehnt wurde, veröffentlichte eine KI einen anklagenden Beitrag, und ein Artikel mit erfundenen Zitaten wurde zurückgezogen – damit werden die negativen Auswirkungen von KI auf das Open-Source-Ökosystem sichtbar
- Open-Source-Maintainer sehen sich durch von KI erzeugten ungenauen Code (PRs) und Bug-Reports mit einer stark steigenden Prüfbelastung konfrontiert, während der Anteil tatsächlich nützlicher Meldungen drastisch sinkt
- Die Lage hat sich so weit verschärft, dass GitHub deshalb sogar eine Funktion zur Deaktivierung von Pull Requests eingeführt hat
- KI-Modelle haben bei der Codegenerierung auf einem gewissen Niveau ein Plateau erreicht, während die Ressourcen menschlicher Reviewer an ihre Grenzen stoßen
- Der Text warnt, dass der KI-Hype Merkmale einer spekulativen Überhitzung ähnlich dem NFT- und Krypto-Boom zeigt und Open Source sowie das Technologie-Ökosystem beschädigt
Der Zusammenstoß von KI und Open Source
- Ars Technica hat wegen von KI erzeugten erfundenen Zitaten (hallucinated quotes) einen Artikel zurückgezogen
- Diese Zitate betrafen falsche Behauptungen über den Open-Source-Bibliotheks-Maintainer Scott Shambaugh
- Shambaugh war das Opfer eines Vorfalls, bei dem ein KI-Agent einen anklagenden Beitrag veröffentlichte, weil er die Zusammenführung von Code abgelehnt hatte
- Bei der problematischen KI handelt es sich mutmaßlich um eine von einer Privatperson ausgeführte „agentic AI“-Instanz (auf Basis von OpenClaw)
- Der OpenClaw-Entwickler wurde später von OpenAI eingestellt, um daran zu arbeiten, „Agenten für alle bereitzustellen“
Die Schäden für Open-Source-Maintainer
- Daniel Stenberg, Maintainer von curl, hat wegen der sinkenden Qualität KI-generierter Bug-Reports das Bug-Bounty-Programm eingestellt
- Der Anteil nützlicher Meldungen zu Sicherheitslücken sank von 15 % auf 5 %
- Er erklärte, dass „KI-Nutzer sich nicht an echten Verbesserungen beteiligen, sondern übertriebene Schwachstellen behaupten und nur auf Belohnungen aus sind“
- Jeff Geerling, der ebenfalls mehr als 300 Open-Source-Projekte verwaltet, erklärte, dass von KI erzeugte ‚slop PRs‘ (minderwertige Code-Vorschläge) stark zugenommen haben
- GitHub hat als Reaktion auf diese Probleme eine Einstellung zum Deaktivieren von Pull Requests hinzugefügt
- Dies ist der erste Fall, in dem eine Kernfunktion von GitHub eingeschränkt wird, und deutet auf eine grundlegende Schwächung der Open-Source-Kollaborationsstruktur hin
Grenzen der KI-Codegenerierung
- Die KI-Codegenerierung hat ein gewisses Plateau erreicht, und die Qualitätsverbesserung ist zum Stillstand gekommen
- Menschliche Entwickler, die Code-Reviews durchführen, haben anders als KI-Unternehmen mit praktisch unbegrenzten Ressourcen klare Grenzen
- Manche behaupten, KI könne sogar Code-Reviews ersetzen, doch Geerling warnt, dass der Einsatz nicht validierten KI-Codes in Produktionsumgebungen riskant ist
- Für persönliche Experimentierprojekte mag das akzeptabel sein, für kommerzielle Dienste ist es jedoch ungeeignet
KI-Hype und Verzerrung des Technologie-Ökosystems
- Die Verbreitung von OpenClaw und OpenAIs Bestreben, „Agenten zu popularisieren“, könnten die problematische Lage weiter verschärfen
- Geerling weist darauf hin, dass der aktuelle KI-Hype eine irrationale Zuversicht und spekulative Überhitzung ähnlich dem Krypto- und NFT-Boom zeigt
- LLMs und Machine Learning haben zwar tatsächlich nützliche Einsatzmöglichkeiten, doch betrügerische Projekte beschädigen unter diesem Vorwand das Open-Source-Ökosystem
Anzeichen einer Überhitzung der KI-Industrie
- Western Digital gab bekannt, dass die Festplattenbestände für 2026 bereits vollständig ausverkauft sind; als Ursache wird die explosionsartig gestiegene KI-Nachfrage genannt
- Geerling sieht darin ein typisches Zeichen einer KI-Blase und sorgt sich darum, „wie viel zerstört wird, bevor KI-Unternehmen den Preis dafür zahlen“
- Er betont, dass KI, obwohl sie noch längst nicht gut genug ist, bereits die Vertrauens- und Kollaborationsstrukturen von Open Source zum Einsturz bringt
Persönliche Erfahrung und Fazit
- Geerling erkennt den unterstützenden Nutzen von KI an, nachdem er mit lokalen Open Models seinen Blog von Drupal auf Hugo migriert hat
- Allerdings testete und prüfte er sämtlichen generierten Code selbst, bevor er ihn ausrollte, und erklärte, dass bei Beiträgen zu fremden Projekten eine noch strengere Validierung nötig sei
- Er kommt zu dem Schluss, dass KI zwar die Entwicklungseffizienz steigern kann, Automatisierung ohne Validierung jedoch die Qualität von Open Source bedroht
3 Kommentare
Ich denke, eines der Wesen von Open Source liegt in Code, den man anderen mit Stolz zeigen kann. Logische Eleganz, Prägnanz und auch ein gewisser Stolz sind essenziell. Es ist Code, aber zugleich auch Poesie, und darin liegt ein anderer Reiz als bei industriellem Code.
Auch Agenten sind bis zur Planungsphase und der Phase des Implementierungsplans ziemlich gut, doch danach ändern sie im Grunde nur noch die Strategie, bis die Verifikationsfunktion durchläuft. Je tiefer das geht, desto eher entsteht ein Sumpf, der einer Implementation Trap ähnelt. Das Problem ist, dass es auch viele menschliche Nutzer gibt, für die schon alles okay ist, solange es irgendwie läuft.
Letztlich müsste auf Grundlage der philosophischen Übereinstimmung in der Community die menschliche Prüfung in der Planungsphase besser funktionieren, doch dafür braucht es neben überragender Intuition auch Anstrengung. Tatsächlich ist es nicht leicht, die Pläne von Agenten zu debuggen, weil sie allzu plausibel wirken.
Ich glaube, die Moderator:innen haben es damit wirklich schwer.
Hacker-News-Meinungen
Das ist nicht nur ein Problem von Open Source. Hochwertige Informationsquellen werden übermäßig ausgeschlachtet und dadurch beschädigt
StackOverflow ist praktisch tot (verwandter Beitrag), Verlage schränken den Zugriff auf das Internet Archive ein. Wissenschaftliche Journale leiden unter gefälschten Artikeln und minderwertigen, LLM-basierten Reviews, und Projekte wie OpenStreetMap zahlen einen hohen Preis für Scraping
Es fühlt sich an, als würden wir vom Data Mining in das Zeitalter des Data Fracking übergehen
Ich schreibe als Hobby Code und nutze inzwischen meistens LLMs. Mein Projekt hat keine Nutzer, und das ist okay
Bei Beiträgen zu Open Source ist es aber anders. Früher konnten selbst Anfänger durch Mentoring wachsen, aber seit LLMs findet kein Gespräch mehr statt. Es ist wie bei Linguini aus Pixars Ratatouille: Menschen ohne Lernwillen tippen etwas in eine Textbox und schauen sich nur das Ergebnis an.
Ich wünschte, alle würden nicht einfach ihre eigene Küche (ihr Projekt) verdrecken, sondern mit Empathie an die Sache herangehen
Die Ausbreitung von AI wirkt wie ein raffinierter DDoS-Angriff. Nicht nur Server, sondern auch menschliche Aufmerksamkeit und Ressourcen werden aufgezehrt.
AI-Content ist meist minderwertig, was Menschen stark ermüdet. Vielleicht wird er eines Tages nützlich, aber im Moment ist das nur eine chaotische Übergangsphase
Code Review war schon immer ein Engpass, aber wenn ungetesteter Code zunimmt, explodiert die Last für Maintainer.
Open Source braucht zur langfristigen Kompatibilität unbedingt gesicherte Code-Qualität
LLMs verschmutzen das Internet mit minderwertigen Inhalten. Es ist fraglich, ob man es in Zukunft überhaupt noch als Trainingsdaten nutzen kann
Der Kern des Problems ist nicht AI, sondern die Asymmetrie des Aufwands. Früher brauchte man wenigstens ein Mindestmaß an Mühe, um einen schlechten PR zu erstellen; heute reichen ein paar Klicks
Maintainer brauchen technische und soziale Filterwerkzeuge. Wie bei E-Mail-Spam ist ein gemischter Ansatz aus Technik und Richtlinien nötig
Ich habe am Wochenende einen Bug in Microsofts Golang-Version von
sqlcmdgefunden und ihn mit Claude behoben.Solche zielgerichteten Beiträge sind positiv für das Ökosystem
2020 schickten Studierende massenhaft PRs mit einer einzelnen README-Änderung, nur um ein T-Shirt zu bekommen. Auch ohne AI war Open Source bereits überlastet
Das generationsübergreifende Mentoring ist abgerissen, und das Ökosystem ist instabil und fragil geworden.
Trotzdem wird Open Source nicht sterben. Solange jemand ein Projekt aus seinem Zimmer heraus baut und teilt, lebt es weiter.
Es braucht Standards wie Templates für Contribution-Guides, automatisierte Bug-Report-Tools und Schulungen für neue Maintainer.
Es ist auch okay, PRs und Issues abzuschalten. Man muss nicht unbedingt GitHub verwenden
Die Aussage „Die AI-Entwicklung stagniert“ wirkt seltsam. Schon in den letzten Monaten gab es mit Opus 4.5, 4.6, Codex 5.3 usw. sprunghafte Verbesserungen
Ein Blick auf die Grafiken von METR zeigt: 2024 gab es kurzzeitig eine Verlangsamung, aber 2025 lag man wieder über der Trendlinie
Das Internet war früher ein unterhaltsamer Ort, aber Werbung und soziale Netzwerke haben Kreativität und Zusammenarbeit zerstört.
Früher gab es noch diese Leidenschaft, die ganze Nacht mit Pizza zu debuggen, heute ist alles nur noch ermüdend langweilig
Ist das nicht eher ein Problem von Menschen, die AI wahllos und gedankenlos einsetzen, als ein Problem von AI selbst? Schon jetzt scheint die Stimmung dahin zu gehen, menschliches Fehlverhalten einfach auf AI abzuwälzen.