Qualität im Zeitalter von Slop
(sinclairtarget.com)- Unter Rückgriff auf den Kernbegriff Quality (Qualität) aus dem Bestseller "ZAMM" von 1974 untersucht der Text, ob „guter Code“ und ein craftsman ethos in einer Zeit der Verbreitung von AI-Coding-Tools noch immer gelten
- Während AI massenhaft Code produziert, wird die Befürchtung als the Maw (der Abgrund der Sinnleere) bezeichnet, dass am Ende nur noch „funktionierender Code und nicht funktionierender Code“ übrig bleibt und die Unterscheidung zwischen schönem, herausragendem oder wertvollem Code verschwindet
- Motorradwartung und Softwarewartung sind im Kern dieselbe Tätigkeit; in beiden sind sorgfältige Beobachtung und präzises Denken entscheidend
- Pirsigs Begriff Quality vereint romantisches und klassisches Verständnis; selbst in den Grundlagen von Wissenschaft und Mathematik sind ästhetische bzw. Qualitätsurteile eingebettet
- Wenn man das Codieren an AI-Agenten delegiert, verliert man caring (Identifikation) und das „Gefühl für die Qualität der Arbeit“; daher ist die Haltung wichtig, in der eigenen Arbeit nach human excellence (menschlicher Exzellenz) zu streben
Das Buch ZAMM
- Dieser Text handelt fast vollständig von dem Bestseller "Zen and the Art of Motorcycle Maintenance (ZAMM)" aus dem Jahr 1974 und zugleich auch von AI
- ZAMM gilt als ein aufgeblasen prätentiöses (pretentious) Buch; auf GoodReads hat es 3.78 Punkte, zugleich gibt es viele vernichtende Rezensionen
- „Zora“ vergibt einen Stern und nennt es eine pseudophilosophische Schrift, als Roman getarnt, keine drei Minuten Lesezeit wert und ein größerer Schwindel als die Bibel
- „Lala BooksandLala“ vergibt einen Stern mit nur einem Satz: „absolutely not“
- Ehrlich gesagt räumt der Autor ein, dass ein Blogpost über ZAMM und AI womöglich nicht besonders vergnüglich klingt
the Maw — der im Tech-Sektor geöffnete Abgrund der Sinnleere
- the Maw ist ein Abgrund des Nihilismus mitten in der Tech-Industrie; ungefähr 63 % der Blogposts auf Link-Aggregatoren wie Hacker News behandeln dieses Thema
- Zu den jüngeren einschlägigen Texten zählen “Do I Belong in Tech Anymore?”, der zehnteilige “The Future of Everything is Lies, I Guess.” sowie “I Think I’m Done Thinking About Gen AI for Now,”
- Software Engineers scheuen neue Technik normalerweise nicht, suchen aber dennoch nach Gründen, die neuesten agentic coding tools abzulehnen, und empfinden die Implikation als unangenehm, dass lineare Algebra Software schreibt
-
Debatte Commenter A vs Commenter B
- Kommentator A beschwert sich, Claude Code habe einen Funktionsnamen vergeben, der auf subtile Weise irreführend sei
- Kommentator B, ein Maw-Anhänger, entgegnet, AI lese den gesamten Funktionsrumpf und erfasse daraus die Bedeutung, daher seien Namen bedeutungslos und bald würden Menschen Code ohnehin nicht mehr lesen
- Die Behauptung von Kommentator B klingt letztlich wie die These, dass die gesamte Disziplin des Software Engineering – Wissen über Best Practices, Architektur und Wartbarkeit – nutzlos werde
- Das Beängstigendste an the Maw ist, dass es die Unterscheidung zwischen gut und schlecht für immer abschaffen und eine Welt schaffen will, in der es nur noch funktionierenden und nicht funktionierenden Code gibt, aber keinen schönen, herausragenden oder geistreichen Code
- Die Kernfragen lauten: Gibt es noch gute Programmierer und guten Code?, warum ist dieses „Gutsein“ wichtig?, und wie sieht ein guter Programmierer aus, der AI-Tools nutzt?
ZAMM ist in Wahrheit ein Buch über Programmierung
- ZAMM könnte praktisch ebenso gut "Zen and the Art of Software Maintenance" heißen; Motorradwartung und Softwarewartung sind im Wesentlichen dieselbe Tätigkeit
- Das Wesen von Wartung ist keine körperliche Arbeit, sondern sorgfältige Beobachtung und präzises Denken; der Mechaniker konzentriert sich auf mentale Bilder und Hierarchien (Kapitel 9 von ZAMM)
- Ob ein Motorschaden oder ein Webservice mit Deadlock: Der Debugging-Prozess ist derselbe; wie im „wired in“-Meme aus The Social Network von 2010 baut auch der Mechaniker im Kopf einen Turm aus Abstraktionen
- Die direkten physischen Ratschläge in ZAMM sind nur zwei (je einen Stuhl auf beide Seiten des Fahrrads stellen, um den Rücken zu schonen; Präzisionsteile behutsam behandeln); alles Übrige betrifft den Geisteszustand des Mechanikers
-
Gumption Trap (Motivationsfalle)
- Gumption ist ein Vorrat an Willenskraft für die intellektuelle Tätigkeit der Wartung, verglichen mit „psychic gasoline“
- Eine Gumption trap ist ein Ereignis, das diese Motivation während der Wartung auf einmal aufbraucht
- intermittent failure setback: Das Problem verschwindet genau in dem Moment, in dem man es beheben will; in Software entspricht das could-not-reproduce / Heisenbug
- impatience trap: Man unterschätzt die benötigte Arbeitszeit, gerät unter Termindruck, nimmt Abkürzungen und verursacht dadurch einen großen Fehler, der noch mehr Verzögerung bringt
-
Pirsig war Computer-Enthusiast
- Im Smithsonian sind zusammen mit einer Honda Super Hawk von 1966 auch ein Apple II mit sieben eingesteckten Erweiterungskarten ausgestellt
- Der Apple II erschien 1977 und wurde also nach der Veröffentlichung von ZAMM gekauft, doch schon davor arbeitete Pirsig bei Honeywell als technical writer
- In ZAMM finden sich mehrere Vergleiche mit Schaltkreisen und Handbüchern für digitale Computer; wäre das Buch 10 bis 20 Jahre später geschrieben worden, wäre es wohl ein Buch über Computer geworden
Quality (mit großem Q) — der Kerngedanke von ZAMM
- Dass ZAMM von Wartung handelt, ist letztlich ein Zugang zu seinem Kerngedanken, Quality (Qualität)
- ZAMM ist aufgebaut wie eine Art intellektueller Kriminalroman
- Der Ausgangspunkt liegt in Kapitel 1, als Pirsig bemerkt, dass seine Haltung zum Motorrad und die seines Begleiters John sehr verschieden sind
-
Der Gegensatz zwischen John und Pirsig
- John kauft den möglichst zuverlässigen deutschen BMW, um die lästige und unschöne Arbeit der eigenen Wartung zu vermeiden
- Pirsig sieht Schönheit in der inneren Funktionsweise des Motorrads und hält die Weigerung, sie verstehen zu wollen, für unpraktisch
- Ob es eine Idee gibt, die beide Sichtweisen zusammenbindet, ist das Mysterium von ZAMM
- Johns Haltung entspricht einem romantischen Verständnis (Gefühle, unmittelbare Eindrücke), Pirsigs Haltung einem klassischen Verständnis (grundlegende Form, logische Abstraktion)
- Pirsig meint, viele Menschen der 1960er und 1970er hätten Technik als feindlich, kontrollierend und „square“ empfunden, und weil Gesellschaft und Technik zu sehr vom klassischen Verständnis beherrscht wurden, seien beide Verständnisse auseinandergeraten
- Weil beide Verständnisse getrennt wurden und die Gesellschaft vom klassischen Verständnis dominiert war, brauchte es eine fulcrum idea – eine tragende Idee –, um sie zu versöhnen
-
Erkenntnis im Rhetorikunterricht
- Pirsig erinnert sich an seine Zeit als Hochschuldozent für Rhetorik, in der er sich fragte, was genau er den Studierenden eigentlich beibringen solle
- Seine Aufgabe war es, den Studierenden gutes Schreiben beizubringen
- Gutes Schreiben lehrte er über Mittel wie metaphor, parallelism und anaphora, doch ein Text kann trotz all dieser Mittel schlecht sein und ohne sie gut
- Die Studierenden konnten auch ohne Kenntnis dieser Mittel gutes von schlechtem Schreiben unterscheiden; nötig war also ein romantisches Verständnis, das sich an der Universität – der Bastion des klassischen Verständnisses – nur schwer lehren lässt
- Was Pirsig eigentlich zu lehren versuchte, war Quality
Etwas, das jeder erkennen kann, das sich aber nicht formal definieren lässt, und ein Begriff, der romantisches und klassisches Verständnis zu einem Ganzen verbindet
-
Die Metaphysik von Quality und die Exzellenz der Benennung
- Ob ein Text, ein Motorrad oder eine Erfahrung hohe oder niedrige Quality hat, lässt sich nicht messen; deshalb ist sie nicht objektiv, doch weil Quality nach dieser Sicht das Subjekt erst hervorbringt, ist sie auch nicht bloß subjektiv
- Quality ist nicht objektiv, weil sie nicht messbar ist, und auch nicht subjektiv, weil sie dem Subjekt vorausgeht; sie ist ein Sieb (sieve), das schon vor der Trennung von Subjekt und Objekt wirkt
- Die Exzellenz des Namens „Quality“ liegt darin, dass er „hoher Wert“ und „Merkmal/Eigenschaft“ miteinander verschränkt und so andeutet, dass das Gute, über das seit Plato argumentiert wird, unmittelbar vor Logik und Vernunft wahrgenommen wird
- Pirsig sieht Wissenschaft und Mathematik zwar innerhalb ihrer jeweiligen Bereiche als konsistent und logisch, meint aber, dass an ihren Grundlagen und Rändern Qualitätsurteile wirksam sind
- In der Geometrie ist nach Festlegung der Axiome eine sichere Deduktion möglich; wählt man jedoch andere Axiome, entsteht eine andere Geometrie, und welche Axiome „richtiger“ sind, hat eher mit Geschmack und Zweckmäßigkeit zu tun
- In der Wissenschaft sagt die wissenschaftliche Methode nach der Formulierung einer Hypothese zwar den nächsten Schritt an, aber unter zahllosen möglichen Hypothesen zu wählen, ist eher eine Kunst, für die es kein festes Verfahren gibt
- Henri Poincaré sagte, dass Mathematiker oder Wissenschaftler an der Wissensgrenze aus vielen Möglichkeiten wählen müssen, die sich aus bestehenden Gesetzen ergeben, und dass die Regel, die diese Wahl leitet, zu fein ist, um sie genau zu formulieren – man muss sie eher fühlen als formalisieren
- Auch Occam’s Razor fordert, die einfachere Theorie zu wählen, doch das Urteil darüber, was eine unnötige Erklärung ist, bleibt letztlich ein ästhetisches Urteil und ein Quality-Urteil
- Die Maxime „Wissenschaft und ihr Kind, die Technik, seien wertneutral, also quality-free“ muss verworfen werden; der Eindruck von Quality fungiert als Spitze der Lokomotive, die dem Zug des Wissens die Richtung weist
AI-Kritik und ZAMMs Antwort
- Ein großer Teil der AI-Kritik konzentriert sich darauf, ob agentische Tools tatsächlich so funktionieren wie beworben – etwa wenn sie eine Codebase beschädigen oder nicht existierende Funktionen halluzinieren
- Auch wenn man einräumt, dass heutige AI-Tools häufig Fehler machen, kann die Debatte über ihre Effektivität am Kern vorbeigehen
- Viele Engineers möchten agentische Tools womöglich selbst dann nicht nutzen, wenn sie genau wie beworben funktionieren würden
-
Im Text "I Think I'm Done Thinking about Gen AI"
- lässt sich die pragmatische Behauptung der Gegenseite nicht mit Daten widerlegen; die eigenen Erfahrungen mit genAI waren zwar sehr schlecht, sind aber nur Anekdoten, und es gibt kaum wissenschaftliche Daten
- die ästhetischen Eigenschaften von genAI werden als extrem unangenehm beschrieben; darin liegt die Wurzel der negativen Voreingenommenheit, und das Fazit lautet, dass man es nicht einmal gratis nutzen würde
- ZAMM hat mir in zwei Punkten geholfen
-
Erstens — ich steckte im klassischen Denken fest
- Die wichtigste Rolle von Quality ist die Erweiterung der Vernunft, indem sie irrationale Elemente aufnimmt, die zuvor nicht akzeptiert wurden
- Dass solche irrationalen Elemente nicht assimiliert werden, führt zum modernen „verwirrten und zersplitterten Geist“, und weil klassisches Denken dominierte, wurde die instinktive Ablehnung von AI abgewertet (discounted)
- Alle Meinungen sind gleichermaßen subjektiv, und selbst angesichts von Studien wie „mit Coding-Agenten steigt die Code-Menge um 50 %“ besteht die Berechtigung zu fragen: „Warum wird dieser zusätzliche Code überhaupt benötigt, und welches Quality-Urteil trägt zum menschlichen Gedeihen bei?“
-
Zweitens — die eigene Ablehnung verstehen
- Moderne Technik wird von einer Sichtweise der Subjekt-Objekt-Trennung beherrscht; Produktmanuale setzen den Nutzer als unbeteiligte Person voraus, die das Produkt lediglich „bedient“
- Es ist eine Gesellschaft, in der gleichgültige Menschen Technik herstellen und sie an gleichgültige Menschen verkaufen
- Die Lösung besteht darin, dass Techniker sich mit ihrer Arbeit identifizieren (identify); wenn die Trennung von Subjekt und Objekt verschwindet, entsteht caring, und dahinter tritt Quality hervor (Kapitel 25 von ZAMM)
- In der Arbeit von Augenblick zu Augenblick gibt es tausend Wege, die klassisch betrachtet alle gültig sind; nur eine an Quality orientierte Occam’s Razor – ein Sinn für das Gute – bringt einen voran (Kapitel 24 von ZAMM)
- Wenn man das Codieren an Agenten übergibt, verliert man das „Gefühl für die Qualität der Arbeit“; LLMs sind nützlich für Suche und Rubber-Ducking, aber randomness ist ihnen wesentlich, sie produzieren Code in schwer einholbarer Menge, erhöhen die Reibung zwischen Mensch und Arbeit und erschweren dadurch caring
-
Schluss — im eigenen Werk Vorbild sein
- Der Text hofft auf eine Welt, in der Menschen sich mit ihrer Arbeit identifizieren und nach Exzellenz streben, und sagt, das Einzige, was man tun kann, sei, im eigenen Werk ein Vorbild zu setzen
„Der erste Schritt, die Welt zu einem besseren Ort zu machen, beginnt genau im eigenen Geist, im eigenen Kopf und in den eigenen Händen, und von dort muss er nach außen gehen. Andere mögen darüber sprechen, wie sich die Zukunft der Menschheit erweitern lässt, aber ich möchte einfach nur darüber sprechen, wie man ein Motorrad repariert. Ich glaube, das, was ich sage, wird länger von Wert sein.“ – ZAMM, Kapitel 25
1 Kommentare
Lobste.rs-Meinungen
Ich fürchte, dass Softwareentwicklung zu einem Job als wandelnde Spezifikation wird. Nicht weil Agenten tatsächlich die schwierigsten und heikelsten Teile des Berufs erledigen können, sondern weil der Großteil der Software in der Welt schon immer fragwürdiger Kram war, der nur irgendwie gerade so laufen musste
Zusammen mit dem typischen Markt für Lemons würde das dazu führen, dass die meisten SaaS-Produkte zu fehlerbehaftetem Ramsch werden und Käufer nicht mehr in der Lage sind, die guten von den schlechten zu unterscheiden. Dann sinken Preis und Nachfrage. Irgendjemand wird weiter Software benutzen, aber die Gesamtzahl der Beschäftigten wird zurückgehen, und der Großteil der Arbeit dürfte darin bestehen, Ramsch zu verwalten. Die Ausnahme wären ein paar Glückliche, die an Dingen wie „Systems of Record“ arbeiten, die wirklich korrekt funktionieren müssen
Mittelfristig sehe ich das so, und das eigentliche Ziel der AI-Labore ist es, etwas zu bauen, das die gesamte intellektuelle und physische Arbeit des Menschen billiger ersetzt. Sie wissen noch nicht, wie, aber sie werden es versuchen, selbst wenn sie dafür den letzten Dollar auf der Erde ausgeben müssen. Was Investoren sich erträumen, kommt faktisch einem evolutionären Nachfolger der Menschheit nahe
Meine persönliche AI-Politik ist folgende. Wenn Handwerk wichtig ist, will ich Coding-Agenten als Assistenten des Künstlers einsetzen, so wie jene Leute, die bei großen Malern die Hintergründe gemalt haben. Opus 4.8 ist schon zu schlau und deshalb eher ungeeignet; in ein oder zwei leichtsinnigen Stunden kann es eine Codebasis aus dem Blick verlieren. Im Moment mag ich Qwen3.6 27B, weil es klug genug ist, in Code, den ich verstehe, Bugs zu verfolgen, zu refaktorieren oder klar spezifizierte Features umzusetzen. Aber in dem Moment, in dem ich selbst das Verständnis des Codes verliere, wird auch das Modell verwirrt, und man zahlt sofort den Preis
Als öffentliche Politik halte ich es für töricht, ohne jede Garantie auf Koexistenz den eigenen evolutionären Nachfolger zu bauen. Deshalb lehne ich die Schaffung echter menschlicher Intelligenz auf diesem Niveau entschieden ab. Diese Ablehnung müsste aber auf Ebene internationaler Verträge erfolgen. Nicht durch Scheinverträge, sondern durch solche, bei deren Verletzung die USA und China entschlossen wären, tiefgreifende Spannungen zu riskieren und Trainingsläufe zu stoppen. Ein Verbot regionaler Rechenzentren wäre nett, aber wenn jemand in Iceland oder dem Middle East SkyNet baut, muss man am Ende trotzdem gegen SkyNet kämpfen. AI zu stoppen ist im Kern ein Problem auf Staatsebene, und Open-Source-Maintainer mit AGENTS.md-Dateien zu schikanieren ist keine ernsthafte Praxis
Deshalb stimme ich dem Original weitgehend zu. Softwareentwicklung kann echtes Handwerk sein, und ich habe 30 Jahre lang etwas geliebt, wofür ich gut bezahlt wurde. Aber wenn Modelle sehr viel besser werden, besteht das Risiko, dass wir in eine Welt geraten, in der es mehr Menschen gibt, die Software-Handwerk wirklich lieben, als es reale Nachfrage gibt. Die dunkle Materie interner Unternehmens-Apps wird wahrscheinlich schon mit etwas besserem Ramsch als heute weitgehend zufrieden sein, und genau darin steckt der Großteil der realen Jobs in diesem Beruf
Ich trauere um den gewählten Beruf, aber noch mehr um die Welt und die Menschheit. Es ist nicht nötig, den gesamten Reichtum zu investieren, um etwas zu bauen, das klüger als Menschen, billiger als Menschen und per
cp-Befehl kopierbar ist. Aber wir werden weiter Ressourcen verbrennen und es versuchenJe älter ich wurde, desto mehr junge Leute sah ich, die Programmieren lernten, weil es ein gut bezahlter Beruf war, und ich konnte schwer verstehen, dass ihnen die Faszination fehlte, die ich dabei empfand. Deshalb trauere ich nicht besonders stark. Wenn die Zahl der Softwareentwickler um 80 % sinken würde, wäre es vielleicht sogar ein besserer Beruf, dem man angehört
Ich stimme auch dem Einsatz von AI als Assistent des Künstlers zu. Selbst die neuesten Modelle kann man nicht lange unbeaufsichtigt laufen lassen, weil man weiß, dass sie es ruinieren würden. Ich bevorzuge allerdings Opus als Assistenten, weil ich nicht alles bis ins letzte Detail erklären muss. Noch lieber wäre mir aber, wenn am anderen Ende ein echter Junior-Entwickler säße, der das Handwerk lernen kann. So wie es bei echten Assistenten von Künstlern war
Was mir an „The Maw“ am meisten Angst macht, ist die Vorstellung, dass es die Unterscheidung zwischen dem Guten und dem Schlechten für immer verschlingen will. Deshalb trifft mich der Satz so genau, dass als Ergebnis eine Welt bleibt, in der schöner, herausragender, tugendhafter oder unterhaltsamer Code verschwindet und nur noch funktionierender Code und nicht funktionierender Code übrig bleiben
Wenn man beruflich Code schreibt, muss man Anforderungen erfüllen, und damit hat es sich. Der Zweck eines Unternehmens ist es, Geld zu verdienen, und alles andere wird nachrangig. Seit steigende Zinsen den Geldhahn zugedreht haben, ist der Druck, einfach Code auszuliefern, der gerade genug funktioniert, um Geld zu verdienen, größer als je zuvor
Nach Schönheit und Eleganz zu streben ist ein Luxus, den sich Künstler leisten können, nicht die Aufgabe von Fließbandarbeitern, denen das Programmieren immer ähnlicher wird. Natürlich geraten in so einem Umfeld Lernen, Kreativität und Innovation ins Hintertreffen, aber die Auswirkungen werden wir erst in ein paar Jahren, vielleicht sogar erst in Jahrzehnten spüren. Es ist ein kurzsichtiges Spiel, aber lang genug für die durchschnittliche Amtszeit eines CEO oder bis zum IPO, weshalb wir jetzt dort sind, wo wir sind
Ich bin zwar voreingenommen, weil dieser Artikel ein Buch behandelt, das mein Leben im Alleingang verändert hat, aber insgesamt war er sehr gut. Ich finde nur, mit den geschniegelt wirkenden Angebertexten von Goodreads anzufangen, ist keine gute Idee.
Die Gumption trap hat sehr viel mit Programmierung zu tun, und ich denke, jeder von Pirsig aufgezählte Fall begegnet einem irgendwann in der Laufbahn zwangsläufig. Ich habe dazu auch schon vor der breiten Einführung von LLMs etwas geschrieben.
Der Rat aus ZAMM passt so gut zur Programmierung, dass ich mich fragte, ob Pirsig selbst programmiert hat — und natürlich hat er das. Im Nachfolgeband Lila von Z&AMM wird sogar COBOL ausdrücklich erwähnt.
Ich denke, Qualität lässt sich am besten als eine Schicht beschreiben, die über Subjektivem und Objektivem liegt. Die knappste Erklärung steht in Lila. Wer auf einem heißen Ofen sitzt, kann auch ohne philosophische Argumentation feststellen, dass er sich in einer Situation niedriger Qualität mit negativem Wert befindet; dieser Wert ist dabei kein Urteil oder keine Beschreibung der Erfahrung, sondern die Erfahrung selbst. Wert liegt zwischen Subjekt und Objekt, und dieser Wert wird direkter wahrgenommen und ist realer als das „Selbst“ oder der „Gegenstand“, denen er später zugeschrieben wird.
Wenn du möchtest, gibt es dazu auch weitere Notizen. In Lila versucht Pirsig, ein vollständiges metaphysisches System aufzustellen, wobei er statische Qualitätsmuster in Anorganisches, Organisches, Gesellschaft und Intellekt unterteilt und darüber die undefinierbare dynamische Qualität stellt, die im Zentrum von Z&AMM steht.
Ich denke, man sollte fragen, ob die Einführung von AI selbst ein Ereignis niedriger Qualität ist oder ob sich Sprachmodelle in hoher Qualität in die Arbeit von Programmierern integrieren lassen. Die Art, wie Menschen mit AI in Beziehung treten, fühlt sich für mich nach niedriger Qualität an, aber es ist schwer auszudrücken, weil uns die Sprache und Denkrahmen fehlen, um das auf einer Ebene jenseits des Subjekt-Objekt-Dualismus zu behandeln; deshalb scheint man sich oft dafür zu entscheiden, es als Ganzes abzulehnen.
Auf einer bestimmten Ebene ermöglicht AI einen romantischen Zugang zur Programmierung. Wenn man AI-erzeugte Ergebnisse nur oberflächlich behandelt und nicht tiefer einsteigen will, mag das in dem Moment in Ordnung sein. Wenn man aber tatsächlich in den Code hineinschaut, merkt man, dass es dort keine klassische Struktur gibt, die man freilegen könnte. Das liegt daran, dass das Modell nur so getan hat, als hätte es auf diese Weise gearbeitet, tatsächlich aber nicht. Deshalb scheinen Führungskräfte, Produktdesigner, Investoren und Solo-Gründer, die Technik nur als Mittel zum Zweck betrachten, die Frustration von Entwicklern über AI-generierten Code nicht wirklich zu verstehen.
Die Beobachtung, dass Bedienungsanleitungen für Konsumprodukte die Beziehung zwischen Produkt und Nutzer nur als „Bedienung“ voraussetzen und stillschweigend davon ausgehen, was gutes Backen, gutes Rasenmähen oder gutes Computing ist, gilt noch heute unverändert für die Dokumentation von Softwarebibliotheken und Tools. Ich habe vor Kurzem die Dokumentation von Pi agent gelesen und fand es frustrierend, dass dort vorausgesetzt wurde, man wisse bereits, was eine gute Nutzung ist, und suche nur noch nach Möglichkeiten zur Anpassung an den eigenen Geschmack. Als ich Kollegen fragte: „Und wie benutzt man das dann gut?“, schauten sie mich irritiert an.
Das erinnert mich auch an Vim. Wenn man nur das Vim-Handbuch liest, ist man erst einmal überfordert. Es brauchte Jahrzehnte an Texten darüber, „wie man Vim gut benutzt“. Und später kam man zu dem Schluss, dass die optimale Plattform für gute Vim-Nutzung vielleicht gar nicht Vim selbst ist, woraus dann Kakoune oder Helix hervorgingen.
Als Vater einer zweijährigen Tochter möchte ich zur Erwartung der ersten Tochter gratulieren. Dich erwartet die beste Reise des Lebens. Wenn du Material suchst, das in eine ähnliche Richtung wie Z&AMM geht, empfehle ich Surfaces and Essences von Hofstadter und Sander, den Nachfolgeband Lila sowie die Arbeiten von Sevilla King und John Vervaeke.
Ich habe den Artikel bis zum Ende gelesen. Ob das daran lag, dass der Text gut war, oder an meiner Fähigkeit, lange Texte konzentriert zu lesen, weiß ich nicht, aber ich vermute Ersteres.
Eine Sache, die Robert über Qualität sagt, ist, dass Menschen Qualität unterschiedlich wahrnehmen, nicht weil die Qualität selbst verschieden ist, sondern weil ihre Erfahrungen verschieden sind.
Deshalb frage ich mich, bevor ich im Team über Qualität spreche, zuerst, ob wir dieselbe Erfahrung gemacht haben. Wenn nicht, bringt es nichts zu sagen: „Verbessert die Qualität.“ Man muss konkret sagen, was verbessert werden soll.
Auf AI-generierten Code übertragen frage ich mich daher, ob sich auch „Qualität“ je nach Erfahrung verändert.
Ein wunderschöner Text. Selbst wenn ich aus der AI-Apokalypse nichts anderes mitgenommen hätte, hat sie mich doch zu einer sehr viel tieferen Reflexion über die Beziehung zwischen Softwareingenieuren und dem von ihnen geschriebenen Code gebracht.
Es ist eine große Erleichterung zu sehen, dass noch jemand auf Pirsig aufmerksam geworden ist. In Previously, on Lobsters wurde fast dieselbe Debatte geführt wie die, die Phaedrus mit den Klassizisten über die Frage führte, ob ein Essay Qualität hat — nur dass es diesmal darum ging, ob der Essay von einem Chatbot oder einem menschlichen Studierenden geschrieben wurde.
LLMs als Suchwerkzeug oder als leistungsstarke Rubber Duck zu verwenden, ist sehr nützlich, aber Code von einem LLM schreiben zu lassen, dessen Verkaufsargument im Wesentlichen darin besteht, Zufälligkeit zu enthalten und mehr Code zu produzieren, als ich nachvollziehen kann, wirkt auf mich so, als würde man eine weitere Reibungsschicht zwischen mich und das, was ich erschaffe, einziehen.
In Pirsigs Rahmen entsteht, wenn ein menschliches Subjekt ein physisches Objekt betrachtet, die Qualität dieser Interaktion — also die Quelle des Werturteils über das Objekt — weder dadurch, dass der Mensch sie subjektiv festlegt, noch dadurch, dass die physischen Eigenschaften des Objekts sie objektiv bestimmen, sondern aus der Interaktion selbst. Man könnte sagen, das Urteil ist kontextuell oder partizipativ. Nicht alle Objekte beteiligen sich auf dieselbe Weise. Wenn ein Mensch ein Photon beobachtet, hat das Photon wegen des Kochen-Conway theorem einen inhärenten Freiheitsgrad darin, wie es reagiert, während ein Baum damit beschäftigt ist, Homöostase aufrechtzuerhalten, und auf den Blick kaum reagiert. Dazwischen liegen M. pudica und D. muscipula, die auf Berührung und Lärm reagieren, aber nicht auf den Blick — es ist also nicht einmal ein eindimensionales Spektrum.
Wie reagiert dann ein LLM-Ausführungsgerät oder ein Chatbot auf Beobachtung? Tatsächlich gar nicht. Es ist nur ein endliches und relativ kleines mathematisches Objekt. Alle Eigenschaften sind objektiv, und im Output gibt es weder Wahl noch Variation. Man kann ein pseudorandomisiertes Ausführungsgerät davorschalten, damit es zufällig zwischen plausibleren oder weniger plausiblen Tokens umherwandert, und man kann diese Wanderung steuern, indem man ihm die von uns gewählten Tokens zwangsweise füttert, aber das ist auch schon alles. Dass ein LLM tief wirkt, liegt daran, dass es eine hyperbolische Topologie hat und sich die Erkundung eines hyperbolischen Raums wie ein Hineinzoomen anfühlt, bei dem die Details endlos zunehmen.
Nach Pirsigs Logik gibt es nur zwei Sichtweisen, zu denen man bei LLMs gelangen kann. Die eine ist, dass ein LLM ein kontextuelles System ist, das menschliche Eingaben als Kontext für statistisch plausible Antworten nutzt; die andere ist, dass es ein objektives System ist, das menschliche Eingaben als Anfangssegment statistisch plausibler Äußerungen nutzt. In beiden Fällen ist ein LLM eher ein Spiegel, der den Nutzer auf ihn selbst zurückwirft, und der Nutzer wählt nur den Zugangswinkel. Der gewählte Prompt ist das primäre Mittel kybernetischer Steuerung, um den gewünschten Informations- oder Zustandsraum zu erreichen, und das Modell liefert nur ein voreingestelltes Array von Auswahlmöglichkeiten, das groß genug ist, um den Menschen zu überwältigen. Dass Chatbots einen ELIZA-Effekt auslösen und leicht in Psychosen münden können, könnte daran liegen, dass sie hochauflösende Spiegel sind, die das Bild des Nutzers durch Schmeichelei und Love Bombing verzerren und so gestaltet sind, dass sie abhängig von der Nutzung des Chatbots machen.
LLMs zum Schreiben von Code zu verwenden, fühlt sich für mich wie eine Barriere zwischen mir und dem Computer an. Vibe-Coder räumen das ein, behaupten aber, diese Barriere biete wie jede andere API Abstraktion und Isolation. Doch nach der Spiegelmetapher steht der Spiegel nicht zwischen mir und dem Computer, sondern neben mir. Statt den Computer direkt zu benutzen, ziele ich auf den Spiegel, zoome vorsichtig in genau den richtigen Bereich hinein, und wenn es präzise genug wird, kann ich allein durch die Tatsache, dass ich den Computer aus einem bestimmten Winkel sehen kann, Anweisungen geben. Aber das ist keine Abstraktion, und die Isolation ist sogar schwächer. Es ist nur zusätzliche Arbeit, um einen Blickwinkel zu finden, der vielleicht gar nicht existiert.
Warum Vibe-Coder das tun, könnte daran liegen, dass sie nicht wissen, wie man den Computer beobachtet. HCI ist partizipativ, und Menschen brauchen vor dem Schreiben von Code einen Programmierkontext, also Naurs Theorie aus previously, on Lobsters. Oder es ist Eitelkeit, weil der Spiegel sie selbst zurückspiegelt und sie deshalb lieber in den Spiegel schauen. Aber ich denke wirklich, dass nur diese beiden Wege sinnvoll sein können. Es gibt schon mehr als genug problems between the keyboard and chair, und es gibt keinen Grund, noch eines hinzuzufügen, das die Ausdrucks-/Abstraktionsfähigkeit nicht verbessert.
Persönlich habe ich das Gefühl, dass ich, falls es eine „Linie“ gibt, auf beiden Seiten davon stehe.
Einerseits sehne ich mich nach der Verbindung und Beziehung zu dem Code, den ich ohne AI selbst geschrieben hätte, und ich spüre, dass diese Verbindung verschwindet, wenn ich AI nutze. Das ist real.
Andererseits denke ich, dass der Einsatz von AI mich auf eine höhere Abstraktionsebene hebt und mir auf dieser Ebene die Möglichkeit gibt, Urteilsvermögen auszuüben und meine eigene Sicht auf Qualität einzubringen. Wenn ich AI den Code schreiben lasse, ohne ausreichend beteiligt zu sein, verschwindet oder schwächt sich die Verbindung auf der Ebene des Codes selbst. Aber auf der Abstraktionsebene, auf der ich AI nicht um Beiträge bitte, verschwindet die Verbindung nicht.
In meinen persönlichen Projekten ist diese Ebene die Architektur und die Definition von Schnittstellen. In letzter Zeit baue ich ein Harness und eine Pipeline, die mehrere LLM-Anbieter aufrufen, und ich denke sehr sorgfältig über Input, Output und Kontrollfluss dieser Aufrufe nach sowie darüber, wie man sie zu einem Ablauf kombiniert, der ein größeres Ziel erreicht. Wenn ich dafür Zeit und Aufmerksamkeit aufwende, habe ich das Gefühl, dass ich zwar die Verbindung zum Code selbst verliere, aber nicht die Verbindung zu meiner Absicht und meiner Architektur. Das heißt, für mich sind Qualität und Handwerk nicht nur auf den Teil beschränkt, in dem ich AI einsetze.
Es ist inzwischen eine etwas abgenutzte Metapher, aber es ist ähnlich wie Manager zu werden oder ein eigenes Unternehmen zu führen. Oft heißt es, die schwierigste Passage auf dem Weg zum CEO sei die Hürde der Kontrolle — also der Punkt, an dem man die Kontrolle darüber aufgeben muss, auf welche genaue Weise die eigene Vision erreicht wird. Für den CEO eines hinreichend großen Unternehmens ist es unmöglich, alle Details zu kennen, wie seine Vision umgesetzt wird. Auch für einen CTO gilt Ähnliches, wenn auch in geringerem Maß, weil er sich weiterhin um einen Teil der technischen Details kümmern muss.
Die Trauer, die ich akzeptiert habe, ist, dass es bei jeder einzelnen Tätigkeit einen Trade-off zwischen Zeiteinsatz, Verständnis und Output gibt. Wenn man zwei davon optimiert, wandert die Aufmerksamkeit vom dritten weg. Und dennoch gibt es, egal welche Kombination man optimiert, reichlich Gelegenheit, Urteilsvermögen auszuüben und Qualität zu verleihen.
Ich bin commenter B in diesem Beitrag und habe den Text aufmerksam gelesen. ZAMM habe ich nicht gelesen, aber Zen ein wenig.
Das ist eine ziemlich stichhaltige Aussage. Die meisten Menschen verschwenden freie Verfügungsspielräume – also plötzlich verfügbares Geld oder Produktivitätsgewinne – sofort und machen daraus den größten und nervigsten Müll. In diesem Umfeld gibt es eine klare Verunsicherung.
Menschen, die Computer benutzen, neigen dazu zu unterschätzen, wie viel Handwerkskunst und Mühe nötig waren, um ein Buch zu schaffen. Das gilt selbst dann, wenn man zurückgeht zu Schreibmaschine, Buchdruck, Handschrift, dem eigenen Gedächtnis und sogar nur zur Schönheit von Worten und der Fähigkeit, andere zu überzeugen, diese Worte weiterzutragen.
Dass es Computer gibt, hindert Menschen nicht daran, viel in die Qualität ihrer Ergebnisse zu investieren und Großartiges zu schaffen. Es gibt auf der Welt nur eben auch sehr viel Müll.
Ein Gedanke zu ZAMM: Johns „romantische“ Sicht auf technische Ergebnisse lässt sich, wenn man sie von Fall zu Fall anwendet, praktisch durchaus verteidigen.
Nehmen wir zum Beispiel an, ein Projekt ist auf Open-Source-Infrastruktur angewiesen. Wenn man sich in einen obskuren Kernel- oder Compiler-Bug hineingraben muss, den man leicht umgehen kann und bei dem man die Umgehung nach einer Dokumentation wieder zurücknehmen kann, sobald ihn jemand behebt – was bringt das dem Projekt dann eigentlich? Die Schlussfolgerung ist, dass jeder seine Schlachtfelder klug wählen sollte.