- AI-Modelle sind für viele Programmieraufgaben gut genug nutzbar, kommen aber eher einem Werkzeug nahe, das bestehende technische Fähigkeiten verstärkt, statt Entwickler zu ersetzen
- Es gibt keine Hinweise darauf, dass LLMs Projekte jeder Größenordnung vollständig entwerfen und umsetzen werden und menschliche Entwickler daher bald überflüssig seien
- Matt Perry schloss bei der Arbeit an Motion statt des Q1-Ziels von 60 Issues 160 und erledigte auch das für Q2 geplante große Refactoring an einem Nachmittag im Januar
- Vibe-Coding von Nutzern mit wenig Entwicklungserfahrung gerät nach dem MVP oft ins Stocken; Architekturentscheidungen und Domain-Wissen machen den Unterschied im Ergebnis
- AI ist wie der Anzug von Iron Man mächtig, erzielt aber nicht von selbst dieselben Resultate; strukturiertes Lernen und Können entscheiden über die Wirksamkeit
Matt Perrys Produktivitätsbeispiel
- Matt Perry ist der Entwickler hinter mehreren Animationsbibliotheken wie Popmotion, Motion One und Motion (früher Framer Motion)
- Die Layout-Projection-Engine von Motion ist das Ergebnis anspruchsvoller Ingenieursarbeit
- Matt Perry intensivierte 2026 den Einsatz von AI und schloss statt der für Q1 vorgesehenen 60 Issues 160
- Auch das für Q2 geplante groß angelegte Refactoring von Motion war an einem Nachmittag im Januar auf einmal erledigt
- Das zeigt weniger, dass LLMs besser wären als die besten menschlichen Entwickler, sondern dass sich die Produktivität stark vervielfachen kann, wenn erfahrene Entwickler AI einsetzen
Grenzen von Vibe-Coding ohne Domain-Wissen
- In
/r/vibecodingteilen Menschen mit wenig oder fast keiner Entwicklungserfahrung ihre Erfahrungen mit Vibe-Coding; viele bleiben nach der MVP-Phase stecken - Ohne Anleitung eingesetzte LLMs konzentrieren sich darauf, Code zur Lösung einzelner Prompts zu erzeugen, betrachten die Anwendungsarchitektur aber nicht ganzheitlich und geraten deshalb leicht in Sackgassen
- Erfahrene Entwickler verstärken mit AI das, was sie ohnehin leisten können, während Nutzer ohne ausreichendes Domain-Wissen oft kaum über die „MVP“-Phase hinauskommen
- Selbst mit denselben AI-Tools sind die Ergebnisse nicht gleich; entscheidend sind Urteilsvermögen und strukturelles Verständnis der Nutzer
AI als Werkzeug begreifen
- AI ist ein Werkzeug, und Werkzeuge entfalten ihre Wirkung nur, wenn man sie geschickt einsetzt
- Nur weil man die Gitarre von Jimi Hendrix, die Küche von Gordon Ramsey oder den Tennisschläger von Serena Williams besitzt, erzielt man nicht dieselben Ergebnisse
- Menschen neigen dazu, die Bedeutung von Werkzeugen zu überschätzen, und Marketing nutzt diese Verzerrung aus, etwa wenn Michael Jordans Schuhe mit „air technology“ so dargestellt werden, als würden sie einem die Fähigkeit zum Dunking verleihen
- AI-Agenten werden vermenschlicht, sodass es schwerer fällt, sie als Werkzeuge zu sehen; behandelt man sie wie autonome Roboter, schreibt man ihnen leicht mehr Verdienst zu, als gerechtfertigt ist
- Die passendere Metapher ist der Iron-Man-Anzug: Er macht erstaunliche Dinge möglich, ist aber kein Wesen, das von selbst dieselben Leistungen erbringt
- Selbst wenn Matt Perry den Zugriff auf das Motion-Repository und seine LLM-Tools weitergeben würde, würde der Versuch, in demselben Tempo zu arbeiten, vermutlich nicht zum gleichen Ergebnis führen, sondern eher zu großem Chaos
- Wenn man sieht, was erfahrene Entwickler mit LLMs erreichen, liegt der entscheidende Faktor eher in den Fähigkeiten der erfahrenen Entwickler als im LLM selbst
Whimsical Animations und strukturiertes Lernen
- Whimsical Animations ist ein neu veröffentlichter Kurs zu Web-Animationen
- Über rund 20 Jahre des Bauens von Websites und Webanwendungen wurde Wissen darüber gesammelt, wie man einprägsame und wirkungsvolle Animationen und Interaktionen erstellt
- Es gibt nicht viele Animationsressourcen für Webentwickler, deshalb wurden Konzepte aus der Spieleentwicklung an das Web angepasst
- Konzepte wie lineare Interpolation, simplex noise und delta time gehören nicht typischerweise zum üblichen Kompetenzspektrum von Webentwicklern, können Projekte aber herausragen lassen
- Mit Tools wie ChatGPT ist es leichter geworden, neue Themen zu lernen, doch um effektiv zu lernen, muss man wissen, was man fragen sollte
- Der Kurs bietet ein kuratiertes Curriculum, das verschiedene Techniken vorstellt
- Die benutzerdefinierte Kursplattform wurde aktualisiert, sodass sich alle Übungen und Code-Snippets lokal ausführen lassen
- Dank Unterstützung für die lokale Ausführung lassen sich Challenges in der gewohnten Coding-Umgebung und im üblichen Workflow abschließen
1 Kommentare
Hacker-News-Kommentare
Letzte Woche hatte ich beim Vibe-Coding eines UI-Designs einen Iron-Man-Moment, während auf dem zweiten Bildschirm die Komponententests liefen
Ich habe iterativ Elemente verschoben, Akzente angepasst und verschiedene Layout-Optionen erkunden lassen, und es lief fast wie eine Echtzeit-Schleife, was ziemlich beeindruckend war
Der erzeugte Code war furchtbar, aber ich konnte damit leicht zu einem Design konvergieren, das ich allein nicht hinbekommen hätte, und danach dieses Referenzdesign ansehen und es selbst mit besserem Code umsetzen
Designer könnten umgekehrt sagen: „Claude Design Studio hat ein mieses UI gebaut, aber ich habe es selbst korrigiert, und dafür hat es großartigen Code erzeugt, den ich selbst nicht hätte schreiben können.“
Man soll sich nicht darum kümmern, wie alles verbunden ist; solange es funktioniert, ist es gut, und wenn es kaputtgeht, soll die AI es eben reparieren
Das hat etwas Befreiendes, aber ich weiß nicht, ob ich schon diese AI-Erleuchtung erreicht habe, auch wenn sich der Moment nahe anfühlt
Im Moment verstehe ich die grundlegende Technik noch und könnte es auch selbst bauen, entscheide mich aber für schnelle Iteration, obwohl ich weiß, dass irgendwo ordnungsfähiger Spaghetti-Code entsteht
Das funktioniert, weil ich ungefähr weiß, „wie es sein sollte“, und das Automatisierungs-Framework in diese Richtung lenken kann, besonders bei Projekten, die ich selbst gebaut habe
Wenn Unternehmen lange genug durchhalten, verschwindet dieses Wissen irgendwann vollständig und es bleiben nur die Tools übrig; dann ist es nicht mehr Iron Man, sondern eher eine eiserne Lunge
Prototypen sind praktisch beinahe kostenlos geworden, und man kann die AI einfach verschiedene Architektur- oder Stiloptionen ausprobieren lassen und dann schauen, welcher Code einem besser gefällt
Auch Rewrites und Redesigns funktionieren ziemlich gut, deshalb mag ich das Muster, mehrere Lösungen per Vibe-Coding zu erzeugen, dann einen Ansatz auszuwählen, die Tests zu verstärken und ihn mit großem Refactoring wartbar zu machen
Die nötige Fähigkeit dabei ist zu wissen, was eine gute Architektur ist, und Prompts sowie Validierung so zu entwerfen, dass das Testniveau schnelle Feedback-Zyklen unterstützt oder LLM-Änderungen leichter lesbar macht
Es hält sich nicht zu 100 % daran, aber die Ergebnisse sind gut genug; anschließend prüfe ich die Ausgabe, passe sie ans Template an und übernehme Ideen, die mir gefallen, wieder in das Skill-Template
Das gilt nicht nur für Systemarchitektur, sondern auch für Backend, Frontend, End-to-End-Tests und Dokumentation
Weil ich das gewünschte Ziel kenne, ebenso wie die Art, Code zu organisieren und Tests zu schreiben, dient das LLM vor allem dazu, mir die Langeweile zu ersparen, jedes Mal demselben Template zu folgen
Allerdings braucht es kontinuierliche Aufsicht, und manchmal fasst es Teile an, die es nicht anfassen soll, oder folgt den Anweisungen nicht; außerdem kann die Menge an Output überwältigend sein, daher bleibt Peer Review weiter nötig
Je mehr ich Arbeit mit AI-Tools beschleunige, desto deutlicher wird mir, wie sehr das Ausliefern nützlicher Software tatsächlich eine schwierige Handwerkskunst ist
Claude Code und Codex können zwar den Großteil des Codes schreiben, aber das technische Wissen, das nötig ist, um zu entscheiden, was und wie gebaut werden soll, ist immer noch enorm
Ich baue gerade ein System wie Claude Artifacts, das benutzerdefinierte HTML+JS-Apps sicher in einer iframe-Sandbox innerhalb einer größeren Anwendung ausführt; um zu verstehen, warum das nützlich und machbar ist, braucht man tiefes Wissen über Sandboxing, Sicherheitsbedrohungen, Browser-Sicherheitsmodelle und zahlreiche Plattformfunktionen, die sich über Jahrzehnte entwickelt haben
Jemand, der nur Vibe-Coding betreibt und dieses Verständnis nicht hat, wird so etwas praktisch nie in die Welt bringen, egal wie sehr ein LLM ihn anleitet
Es macht mich traurig, wenn Entwickler sagen, sie würden ihre Karriere wegen AI aufgeben, denn ausgerechnet jetzt ist bestehende tiefe technische Erfahrung wertvoller denn je
Ich schreibe gern Code, aber ich mag es nicht, nach dem Zauberspruch zu suchen, der die Maschine den richtigen Code schreiben lässt, oder ihre Fehler zu beheben, wenn sie falschliegt
Wenn ich gewusst hätte, dass diese Zukunft kommt, wäre ich vermutlich nicht in dieses Feld gegangen
Außerdem ist die Art, wie diese Tools gebaut wurden, für mich Diebstahl, und ich halte es auch für unethisch, Werkzeuge zu nutzen, die auf unethische Weise entstanden sind
Dazu kommt, dass unklar ist, ob ich für wertvollere Fähigkeiten überhaupt mehr Geld bekommen kann, und die Ingenieursgehälter sinken insgesamt
Wenn der Arbeitgeber den gesamten Mehrwert abschöpft, habe ich keinen Grund, mich dafür zu interessieren, dass ich mehr Wert schaffe
Viele Softwareingenieure in meinem Umfeld sind schon zu dem Schluss gekommen, dass AI ihre Jobs übernehmen wird, und denken bereits über einen Berufswechsel nach, aber ich glaube, es ist noch zu früh für so ein Urteil
Alle Prompts, die ich verwende, sind extrem technisch, und ohne meine Fachkenntnis wäre es schwer, Dinge nur über Gespräche mit einem Agenten zu erledigen
Immer wenn ich Dinge außerhalb meines Fachgebiets tue, geht es längst nicht so schnell, wie die Leute sich das vorstellen, und Expertise hilft enorm dabei, Ordnung zu halten
Wenn sie glauben, dass AI Ingenieure ersetzen kann, ist die Wahrscheinlichkeit groß, dass es genau so läuft, und nur selten wissen Führungskräfte wirklich, was Qualität ist
Sie schauen nur auf Umsatz und Gewinn, daher mag es zwar stimmen, dass tiefe technische Erfahrung wertvoller ist, aber die Realität könnte leider trotzdem anders aussehen
Wahrscheinlich wird man eher schrittweise in die Arbeitslosigkeit gedrängt
LLMs ändern an dieser Realität nichts
Deshalb gibt es auch keine Explosion hochwertiger Produkte, denn Produkte zu bauen, die überhaupt Wert schaffen, ist extrem, extrem schwer
Die Haltung, das wegen LLMs auf die leichte Schulter zu nehmen, wirkt auf mich lächerlich
Zu der Aussage, „AI-Tools seien eher wie ein Iron-Man-Anzug“, gibt es ein interessantes Repository mit 63.600 GitHub-Stars
Der Entwickler ist auf Platz 1 der wöchentlich trendenden GitHub-Contributors, aber die Anwendung scheint anders zu sein als beschrieben, und selbst Entwickler scheinen nicht klar beantworten zu können, ob das echt ist
Letztlich zeigt es, dass man nicht allein durch den Anzug zu Iron Man wird, weil es am Ende nur unordentlicher LLM-Output ist
https://github.com/ruvnet/RuView
https://github.com/trending/developers?since=weekly
https://github.com/deletexiumu/wifi-densepose
AI beweist also, dass ein von AI erzeugtes, nicht funktionierendes Projekt nicht funktioniert — was für eine schöne neue Welt
Es gibt viele Projekte, aber es ist einfach sehr viel AI-Output, der die GitHub-Infrastruktur zu überschwemmen scheint, sodass man gut verstehen kann, warum GitHub zu kämpfen hat
Als Mathematiker hatte ich letzte Woche ebenfalls einen Iron-Man-Moment
Ich arbeite seit einigen Jahren mit zwei befreundeten Professoren an gemeinsamer mathematischer Forschung und habe einen Teil der Arbeit mit ChatGPT erkundet
Wenn mir ein Gedanke kam, habe ich ihn GPT vorgelegt, es einfache zu beweisende Sätze formulieren lassen und dann die Beweise in LaTeX ausgeben lassen, wobei ich die Beweise immer sorgfältig überprüft habe
Anschließend ließ ich Mathematica-Code erzeugen und nutzte die Ausführungsergebnisse, um Beweise zu verifizieren oder weitere Ideen zu gewinnen, und iterierte dann erneut
An einer Stelle konnte ich eine obere Schranke für einen bestimmten Ausdruck nicht bekommen und merkte, dass mir dort Verständnis fehlte; ihn mit Papier und Stift selbst noch einmal herzuleiten, war eine große Hilfe
Der gesamte Prozess war etwa zehnmal schneller als ohne GPT, und ein paar Stunden später hatten wir rund 20 Seiten korrekter Beweise sowie den gesamten nötigen Code für die zugehörigen numerischen Simulationen
Ich sehe AI nicht als Multiplikator von Fähigkeit, sondern als Werkzeug zur Zeitersparnis
Für weniger erfahrene Entwickler spart sie sofort Zeit gleich zu Beginn eines Projekts, aber frühe Entscheidungen können einen später ausbremsen
Für Senior-Entwickler verhält sie sich, wenn man genug erklärt, sofort wie ein Junior- oder Mid-Level-Entwickler, der Dinge innerhalb des eigenen Kompetenzbereichs erledigt
Überlässt man ihr jedoch wichtige Entscheidungen, kann sie völlig falsch oder subtil falsch liegen, und gerade subtile Fehler sind am gefährlichsten, weil sie schwer zu entdecken sind
Wenn ein Senior gute Leitplanken setzt und Probleme erkennen kann, steigt die Entwicklungsgeschwindigkeit wirklich absurd stark
Wenn man lernen will, kann AI die Zeit verkürzen, die man braucht, um Fähigkeiten zu verfeinern und zu erwerben, und dadurch durchaus ein echter Fähigkeitsmultiplikator sein
Ich nutze AWS heute viel besser als noch nach mehreren Jahren Nutzung, und auch die Kommandozeile setze ich effektiver ein
Die Informationen waren früher auch auffindbar, aber es dauerte viel zu lange; dass die Zeit bis zur gewünschten Antwort drastisch geschrumpft ist, hat meine tatsächliche Produktivität und Fähigkeit verändert
Ich wollte auf einem Raspberry Pi einen kleinen Webserver laufen lassen und bat Gemini, den Code und ein Konfigurations-Bash-Skript zu schreiben, um ihn als systemd-Service zu starten
Das ist etwas, das ich auch im Halbschlaf hinbekommen könnte, aber es kostet Zeit und Konzentration; während ich diesen Kommentar schreibe, hat es mir genau das gebaut, was ich brauchte
Für sich genommen ist das vielleicht nicht spektakulär, aber wegen anderer Verpflichtungen fehlte mir die Energie für aufgeschobene Home-Automation-Aufgaben, und jetzt erledige ich sie doch
Ja. AI macht reine Fähigkeit oder Begabung nicht obsolet, sondern wertet sie sogar auf
Tiefes technisches Wissen hat in der Praxis einen größeren Hebeleffekt, weil es mehr Ansatzpunkte gibt, an denen man AI anwenden kann
Diese Erkenntnis hat mich dazu gebracht, statt Cloud-Services wie AWS ein Homelab-Rechenzentrum aufzubauen, um mein technisches SaaS selbst zu hosten
Der Wert, grundlegendes Networking, DevOps und Server-Hardware zu lernen, lässt sich dank AI schneller und breiter nutzen
Früher hätte es Stunden oder Tage gedauert, RouterOS zu lernen und einen Mikrotik-Router auf Rechenzentrumsniveau zu konfigurieren, aber dank Claude wurde daraus eine Aufgabe von 20 Minuten, und ich habe nebenbei viel über Routing-Konfiguration gelernt
Ich habe dadurch eine Form einzigartiger Kontrolle gewonnen, die ich mit reiner Cloud-Nutzung nie gehabt hätte, und wegen AI habe ich sogar Lust bekommen, ein eigenes Betriebssystem zu bauen — etwas, das ich mir früher nie zugetraut hätte
Als Elektrowerkzeuge und Nagelpistolen aufkamen, hätte man vermutlich ähnlich gedacht, aber Häuser konnten zwar viel schneller gebaut werden, doch die Löhne sanken, die Arbeitsqualität nahm ab, und der Wert von Können und Erfahrung ging stark zurück
Verputzen war früher ein gut bezahlter Fachberuf, und als Trockenbau aufkam, dachte man, man würde weniger Zeit mit langweiligen glatten Wänden verbringen und mehr mit Ecken und dekorativem Stuck — aber diese Verzierungen verschwanden
Sie kosteten im Verhältnis zum Rest der Wand einfach zu viel Zeit, und die Leute, die diese Fähigkeiten erhalten oder erlernen konnten, wollten weiterhin wenigstens anständig bezahlt werden
Selbst bei gewöhnlichem Trockenbau stiegen die Produktionsanforderungen, während die Löhne stagnierten, und heute sind oft sogar die Fugen miserabel; bezahlt wird vor allem hohe Produktionsgeschwindigkeit und nicht zu klagen
Der „Elefant im Raum“ ist eigentlich ein großes Thema, über das niemand spricht, aber über AI sprechen alle
Ein besserer Titel wäre eher: „Warum AI Entwicklerfähigkeiten verstärkt, statt sie zu ersetzen“
„Der Elefant im Raum“ bedeutete also, dass AI bis zu diesem Zeitpunkt in genau dieser Marketingkampagne noch nicht behandelt worden war
Dieser Link ist eine Webansicht, die zum Lesen gedacht ist, wenn etwas im E-Mail-Client nicht korrekt dargestellt wird; der Text war also nicht für ein breiteres Publikum gedacht
Wenn weniger Entwickler benötigt werden, um dieselbe Arbeit zu erledigen, werden viele Menschen ihren Job verlieren
Wahrscheinlich sinken auch die Gehälter derjenigen, die bleiben
Wenn man glaubt, mit einem Junior-Gehalt plus AI-Abokosten „das gleiche Ergebnis“ zu bekommen, warum sollte man dann ein Senior-Gehalt zahlen
Auf Softwareentwickler kommen wohl harte Zeiten zu, und obwohl ich das seit 15 Jahren mache, freue ich mich nicht darauf
Ehrlich gesagt denke ich über eine Umschulung in eine andere Branche nach; selbst mit weniger Geld wäre es vielleicht besser, diesem Chaos zu entkommen
Ich stimme Josh größtenteils zu, aber viele Beiträge über Senior- und Junior-Erfahrung im Umgang mit AI wirken auf mich ein bisschen wie Unsinn
Es stimmt, dass Seniors mit AI-Tools bessere Ergebnisse erzielen und Juniors sich schwerer tun, aber geändert hat sich vor allem, dass dieser Unterschied verstärkt wurde
Was Leute ausblenden, ist, dass Juniors in jedem Fachgebiet mit AI-Forschungsassistenz sehr viel schneller lernen können, und wer die Ausdauer hat, tief einzusteigen, kann auch schneller zum Experten werden
Ich frage AI-Tools genauso oft Dinge wie „Wie funktioniert das?“ oder „Kannst du ein anderes Tool vorschlagen?“ wie ich sie bitte „Baue das“ oder „Repariere das“
Oft wird AI als reine Input/Output-Beziehung betrachtet, aber das Herumprobieren in der Mitte war schon immer wichtig — mit oder ohne AI
Anfänger können es anfangs nicht, aber das war schon immer so, und gute Leute werden diese Phase des Nichtkönnens deutlich schneller hinter sich lassen, als ich es musste
Allerdings könnte die sofortige Befriedigung durch AI die Erfahrung von Reibung abschwächen, und AI-Natives könnten Reibung weder verstehen noch für nötig halten
Wenn man betrachtet, was man auf Hochschulniveau sieht, fällt es schwer, das zu erwarten
Der Ärger über miserables Vibe-Coding oder Behauptungen von 10-facher Geschwindigkeit verdeckt diesen Punkt
Das wichtigste Lernen passiert nicht, wenn man eine Frage stellt und sofort eine Antwort bekommt, sondern wenn man nach einer Antwort ringt, ein paarmal scheitert, tief nachdenkt, eine kurze Pause macht und dann das Problem löst
Solches Wissen ist wertvoll, weil es nicht nur die Antwort liefert, sondern auch falsche Wege, die man künftig vermeiden kann, und Vertrauen in das eigene Denken
Wenn die nächste Generation diese Phase überspringt, wird sie glauben, Antworten müssten leicht zu finden sein, sich immer stärker auf AI verlassen und immer weniger Vertrauen in den eigenen Kopf haben
In diesem Fall wird man also nicht wirklich ausgebildet, nur weil man LLM-Output liest
Ich habe noch niemanden gesehen, der mit AI-Tools tiefer eingestiegen ist
Senior-Entwickler haben gelernt, indem sie einen Berg von gescheiterten Projekten hinter sich gelassen haben
Wenn jemand vorschlägt, eine Flat-File-Datenbank zu bauen oder eine Microservices-Architektur mit mehr als 50 Lambdas, dann habe ich das schon erlebt und weiß, warum man es trotz technischer Machbarkeit nicht tun sollte
Für mich bringt mich AI mit 100 km/h in die richtige Richtung, aber ich sehe Juniors mit 100 km/h auf das Meer oder gegen eine Wand zurasen
So wie AWS uns dümmer gemacht hat und Juniors hervorgebracht hat, die keinen Reverse Proxy kennen, und High-Level-Sprachen dazu geführt haben, dass Leute Speicherverwaltung nicht verstehen, ist AI nur das nächste Glied in dieser Kette
In zehn Jahren werden die meisten Entwickler vermutlich keinen Code mehr lesen können
Viele, vielleicht sogar die meisten Softwareingenieure sind Experten in ihrer eigenen Codebasis, daher ziehen ziemlich viele Ingenieure hohen Nutzen aus AI
Unklar ist, ob weniger Entwickler gebraucht werden, wenn jeder Ingenieur mehr Code schreiben kann, oder ob dadurch mehr Software in Bereichen entsteht, die traditionell vernachlässigt wurden, wie UX, Tests, Developer Experience und Dokumentation
Vielleicht hebt sich einfach nur die Grundlinie
Beim Gespräch mit Claude ist mir noch etwas aufgefallen
Ich sagte: „Ist es nicht überraschend, dass X besser ist als Y?“, und Claude antwortete mit einer „aufschlussreichen Kritik“ und erklärte gut, warum Y besser sei als X
Die Antwort selbst war gut, durchdacht und logisch, stand aber im Widerspruch zu dem, was ich sagen wollte, also korrigierte ich: „Nein, ich meine die kontraintuitive Behauptung, dass X besser ist als Y.“
Daraufhin sagte Claude wieder: „Stimmt, X ist besser als Y“, und lieferte erneut gut strukturierte Gründe
Das erinnert an so ein Meme vom dummen, klugen Genie
Man schwankt zwischen „Es ist nur Autocomplete“ und „Nein, es hat ein Modell im Kopf“, aber am Ende ist es wie die Bibliothek von Babel: Selbst wenn dort alle Genialität der Welt liegt, ist sie nur mit dem richtigen Indexschlüssel nutzbar
Als erste Näherung sagt ein LLM die Antwort voraus, die der Nutzer will oder erwartet
Die erste Antwort auf den Prompt war komisch, weil das LLM den Nutzer völlig missverstanden und auf Grundlage dessen vorhergesagt hatte, was der Nutzer angeblich geschrieben habe
Die zweite Antwort zeigt noch deutlicher, dass das Ziel des LLM darin besteht, vorherzusagen, was der Nutzer will oder erwartet
Ein großer Auslöser für Halluzinationen ist, dass die vom LLM interpretierte Erwartung des Nutzers nicht mit der Realität übereinstimmt, woraufhin das LLM versucht, die Realität an seine Auffassung dieser Erwartung anzupassen
Eine gute Methode, Halluzinationen zu verringern, ist, im Prompt Aussagesätze so weit wie möglich zu vermeiden
„Ist es nicht überraschend, dass X besser ist als Y?“ enthält eine explizite Behauptung, und das LLM hat zwar die Richtung missverstanden, aber erkannt, dass dort eine Behauptung steckt, und dann Gründe genannt, warum die Realität dazu passt
Ähnlich ist es, wenn Anwälte mit erfundenen Präzedenzfällen in Schwierigkeiten geraten: „Finde mir Präzedenzfälle, die X zeigen“ ist riskant, und „Welche Präzedenzfälle gibt es zu X?“ ist der bessere Ausgangspunkt