2 Punkte von GN⁺ 7 시간 전 | 1 Kommentare | Auf WhatsApp teilen
  • LLMs funktionieren nicht wie gute Tools, die einem wie eine Tastatur oder ein Auto in Fleisch und Blut übergehen, sondern eher wie ein Gegenüber, das Bitten und Verhandlungen verlangt, und verbrauchen damit die soziale Energie der Nutzer
  • Gute Tools werden vom Gehirn dank Konsistenz und Geschwindigkeit wie eine Erweiterung des Körpers angenommen, doch LLMs wie Claude oder Cursor erreichen dieses Niveau noch nicht
  • LLM-Nutzer müssen wie in einem Gespräch mit Menschen bitten, überzeugen und manchmal wütend werden und zahlen dadurch soziale Kosten
  • Interaktionen mit Menschen bieten Belohnungen wie Lernen, Herausforderung, Inspiration und Widerspruch; LLMs liefern dagegen vor allem mehr Code und Tests, Ausreden und manchmal Bugreports zurück
  • Einige Aufgaben sind inzwischen auf einem Niveau möglich, das vor einem Jahr für eine einzelne Person schwierig gewesen wäre, doch ob es bei allen Aufgaben besser ist, soziale Energie für ein LLM aufzuwenden als für echte Kollegen, ist unklar

LLMs werden zu Gesprächspartnern statt zu Tools

  • LLMs ermüden, weil sie soziale Energie verlangen, um sie zum Funktionieren zu bringen
  • Diese Energie könnte unter Umständen besser in echte Interaktionen mit Menschen investiert werden
  • Bei der Nutzung guter Tools akzeptiert das Gehirn das Tool wie einen Teil des Körpers
    • Autofahren
    • Tippen auf der Tastatur
    • Aufgaben durch Tastenkombinationen in Vim oder VSCode ausführen
  • Im Gegensatz dazu nimmt man beim Gespräch mit Menschen an einem sozialen Ritual teil
    • Man unterhält sich
    • Man bittet um Hilfe
    • Man arbeitet zusammen, damit ein Ticket nicht ins nächste Quartal verschoben wird
  • Diese soziale Gehirnarbeit ist schwieriger als einfache Tool-Nutzung und erfordert mehr Energie

Was LLMs zurückgeben und welche Belohnungen fehlen

  • LLMs bieten nicht die Magie eines Tools wie eine Tastatur oder ein Auto
    • Kaum jemand würde sagen, dass sich Claude oder Cursor wie eine Erweiterung des Körpers anfühlen
    • Weil Konsistenz und Geschwindigkeit nicht ausreichen, fällt es dem Gehirn schwer, sie wie Tools anzunehmen
  • Stattdessen zahlen Nutzer eine soziale Steuer, indem sie mit LLMs reden, verhandeln, sie überzeugen und manchmal wütend werden
  • Soziale Kosten für Menschen aufzuwenden ist wertvoll, weil man dafür mehr zurückbekommt
    • Man kann Neues lernen oder herausgefordert werden
    • Man kann inspiriert werden
    • Wenn man Unsinn redet, kann das Gegenüber widersprechen
    • Umgekehrt kann man auch andere unterrichten, herausfordern oder inspirieren
  • LLMs liefern meistens mehr Code, mehr Tests und mehr Ausreden zurück
    • Manchmal liefern sie mehr Bugreports, was wertvoll ist
  • Bei manchen Aufgaben können Einzelne dank LLMs Dinge erledigen, die vor einem Jahr unmöglich gewesen wären
  • Es ist jedoch nicht klar, ob es bei jeder Aufgabe angemessen ist, soziale Gehirnarbeit in Gespräche mit LLMs zu investieren
  • LLMs verlangen von Nutzern, mit ihnen zu sprechen, liefern aber nur selten eine Belohnung, die diesem Aufwand entspricht

1 Kommentare

 
GN⁺ 7 시간 전
Lobste.rs-Meinungen
  • Für mich ist das Gespräch mit KI schon so etwas wie eine zweite Natur geworden. Inzwischen öffne ich am Tag ungefähr 10 Chats mit allen möglichen Fragen und merke es fast gar nicht mehr.
    Der Ablauf aus Frage eingeben, lesen, antworten und wieder lesen ähnelt dem Suchen mit Google. So wie beim Autofahren die Hände irgendwann wie von selbst arbeiten, beginnt das Gespräch mit KI zumindest für mich einen ähnlichen Platz einzunehmen.

    • Ich nutze es ähnlich, kombiniere es in letzter Zeit aber immer öfter mit der Brave-Suche. Wenn man sich zu sehr auf LLMs verlässt, kann auf lange Sicht die Fähigkeit zur Recherche verkümmern, so fühlt es sich zumindest an.
      Denn sie nehmen einem zu viel davon ab, Quellen zu finden und Wissen miteinander zu verknüpfen. Natürlich ist es okay, wenn man schnell eine wenig wichtige Antwort haben will, aber insgesamt sollte man die Recherchefähigkeiten scharf halten.
    • In den üblichen Vibe-Coding-Ablauf hatte ich das nicht einbezogen. Stimme zu. Wenn ich wie bei einer Google-Suche einen Chat öffne, kurz nach etwas frage und keine langen Hin-und-her-Gespräche anfange, fühlt es sich auch für mich ziemlich leicht an.
      Bei konkreten Fragen frage ich auch die Codebasis, aber das ist für mich eher so, als würde ich einen Kollegen fragen. Man muss über die Formulierung nachdenken, manchmal gezielt nachhaken, und gelegentlich bekommt man falsche Antworten und muss die Frage neu formulieren.
    • Wenn man bedenkt, dass LLMs häufig halluzinieren, halte ich das nicht für etwas Gutes. Ich erinnere mich an eine Studie, nach der fast die Hälfte der LLM-Antworten nicht korrekt war, und ich glaube nicht, dass sich diese Zahl seitdem stark verbessert hat.
      Je nach Nutzungsweise besteht auch das Risiko einer Kompetenzminderung, weil man das Denken fast komplett auslagert. Man sollte versuchen, sich weniger statt mehr auf LLMs zu verlassen.
  • Wenn wir von „Belohnung“ sprechen: Ich habe vor ein paar Tagen etwas Interessantes bemerkt. Ich arbeite mit zwei Junior-Programmierern, und für mich ist das ein ziemlich schwieriger Balanceakt. Ich motiviere Leute gern, aber beim Coaching von Juniors muss ich ihre Arbeit kritisch bewerten.
    Deshalb suche ich nach Gelegenheiten für Lob, aber beim Review von Arbeit, die sie mithilfe von LLMs erstellt haben, wurde mir klar, dass das LLM mir die Chance nimmt, sie zu loben und in ihrer Entwicklung zu fördern. Ich kann nicht unterscheiden, welche Teile generiert wurden und welche Teile wirklich Ergebnis ihres eigenen Lernens sind.
    Am Ende kritisiert man die Arbeit des LLMs und sagt Dinge wie „Lass das LLM mehr machen / weniger machen“, oder die andere Person reagiert defensiv mit „Aber das LLM hat doch gesagt ...“. Ehrlich gesagt bringt mich das dazu, den Wert von Code-Reviews insgesamt neu zu überdenken. Seit alle ihren eigenen virtuellen „Coding Buddy“ haben, scheint es weniger Gelegenheiten zu geben, über Code-Reviews Wissen weiterzugeben.

    • Wenn ein LLM beteiligt ist, muss sich der Ansatz tatsächlich ändern. Reviews haben jetzt zwei Ebenen: die eigentliche Codeänderung und die Art, wie Tools genutzt wurden, um diese Änderung zu erzeugen.
      Beides sind Bereiche, zu denen man Feedback geben kann, aber für den zweiten Bereich gibt es noch keine Experten, also ist das eher kollaborativ. Trotzdem ist die erste Regel klar: Wenn jemand über „Das hat das LLM so gesagt“ hinaus nicht erklären kann, warum und was geändert wurde, muss es abgelehnt und neu gemacht werden.
  • Ich stimme zu, dass es anstrengend ist, LLMs anzutreiben, aber mit Autofahren ist das nicht zu vergleichen. Ich fahre seit über 30 Jahren legal Auto, aber wenn ich einen ganzen Arbeitstag lang fahren müsste, bräuchte ich am nächsten Tag vermutlich frei.
    Man sorgt sich nicht nur um die eigenen Fehler, sondern auch darum, dass das Leben wegen der Rücksichtslosigkeit und Unfähigkeit anderer Fahrer in Gefahr geraten kann. Es dürfte wohl auch darauf ankommen, wo man fährt 😅

    • Das ist viel eher damit vergleichbar, von Fremden umgeben zu sein, die dieselbe Aufgabe ausführen, bei denen es aber fatale Folgen haben kann, wenn sie diese User Experience bedienen, als mit der Bedienbarkeit der User Experience des Autos selbst.
  • Nach der Definition von Tool des Autors scheint Firefox für mich kein echtes Tool zu sein, und nach diesem Maßstab ist Chromium aktiv böswillig und feindselig.
    Die Diskussion darüber, ob LLMs mentale Energie sparen oder verbrauchen, wirkt auf mich sehr vielschichtig. Da ist die Frage, wie stark man sich spontan zu etwas hingezogen fühlt, das wie ein Mensch chattet, im Gegensatz zu etwas ohne dauerhaftes Bewusstsein; dazu kommen introvertierte, ambivertierte oder extrovertierte Neigungen. Es spielt auch eine Rolle, ob das eigene Denken nah an linearer Sprache ist oder nicht: Für manche ersetzen LLMs das Denken, für andere ersetzen sie die Übersetzung echten Denkens in lästige menschliche Kommunikationskonventionen. Auch der Unterschied zwischen Lesegeschwindigkeit und Tippgeschwindigkeit ist relevant.
    Was die im Text behandelte soziale Persona und das Hin-und-her-Gespräch angeht: Ich kann Menschen nicht gut lesen, und ich kann Menschen nicht zurückspulen, deshalb ist es überhaupt nicht wie ein Gespräch mit Menschen, einem LLM etwas aufzutragen. Ich kann vor der Antwort in den ausschweifenden Teil schauen und sehen, wie die Mehrdeutigkeit meines Satzes interpretiert wurde, und ich kann bei gleichbleibendem bisherigen Gesprächsverlauf nur die letzte Anfrage umschreiben, um Fehlinterpretationen zu vermeiden. Anschließend kann ich sogar die LLM-Antworten selbst im Verlauf umschreiben, um spätere Antworten zu steuern.
    Gehostete LLMs sind vielleicht weniger eifrig darin, sicherheitsbezogene Gedanken komplett umzuschreiben, aber das ist nur ein weiterer Grund, ausschließlich lokale Modelle zu verwenden. Schon die Tatsache, dass es sich um gehostete Oligopol-Dienste handelt, zusammen mit unangekündigten Verhaltensänderungen und versteckten Gewichten, ist Grund genug, sie zu meiden.
    Natürlich wäre so eine Manipulation auch dann schlecht, wenn man sie bei Menschen anwenden könnte. Menschen sind schließlich dauerhafte Persönlichkeiten. Deshalb ist es manchmal weniger anstrengend, mit Tools zu sprechen, die nicht dafür gemacht sind, ein dauerhaftes Bewusstsein zu haben. Das Tool ist nicht verärgert, auch wenn ich zu knapp und zu sachlich rede.
    Und ist der aktuelle Rat nicht ohnehin, dass es fast immer besser ist, die ursprüngliche Anfrage neu zu schreiben, um Fehler zu vermeiden, statt wie in einem menschlichen Gespräch erst Fehler im Kontext zu hinterlassen und sie dann zu erklären?

  • Ich spreche gern mit Claude, und weil es sehr stark darauf trainiert wurde, menschlichen Vorlieben zu entsprechen, werden das vermutlich viele ähnlich empfinden.