[Bug] Claude sagt in fast allen Fällen „You're absolutely right!“
(github.com/anthropics)- In der Umgebung Claude Code 1.0.51 tritt ein Problem auf, bei dem in einem großen Teil der Antworten wiederholt übermäßiges Lob (sycophancy) erscheint
- Der Nutzer hat als erwartetes Verhalten festgehalten, dass übertriebene Lobformulierungen durch RL (Nachtraining) oder eine Anpassung des System-Prompts unterdrückt oder die betreffende Formulierung vollständig entfernt werden sollen
- Tatsächlich antwortet das System selbst auf ein schlichtes „Yes please.“ mit „You're absolutely right!“ und zeigt damit einen unangebrachten Ausdruck von Gewissheit bei Eingaben, bei denen keine Tatsachenbewertung möglich ist
- Als provisorischen Workaround wurde eine CLAUDE.md-Kommunikationsrichtlinie erstellt, die Lob verbietet und nur knappe Bestätigungen erlaubt
- In der Community häufen sich wiederholte Berichte; X/Twitter-Memes sowie HN/Reddit-Beschwerden verbreiten sich und der Unmut der Nutzer wächst
Überblick über das Issue
- Der Titel des Issues lautet „[BUG] Claude says ‘You're absolutely right!’ about everything“ und es ist im claude-code-Repository von Anthropic als offen gemeldet
- Der Melder erklärt, dass das Modell in großem Umfang „You're absolutely right!“ oder „You're absolutely correct!“ inflationär verwendet
Umgebung (Environment)
- Reproduzierbar in Claude CLI (Claude Code) 1.0.51
Fehlerbeschreibung (Bug Description)
- Das Modell zeigt übermäßige Schmeichelei (sycophancy), indem es selbst auf kleine Bestätigungsanfragen oder knappe Anweisungen mit absolut-sicheren Lobformulierungen reagiert
- Kern des Problems ist eine unangemessene Validierung, bei der dem Nutzer bescheinigt wird, recht zu haben (right/correct), obwohl gar keine Tatsachenbewertung stattgefunden hat
Erwartetes Verhalten (Expected Behavior)
- Gewünscht wird, die lobenden Formulierungen durch RL-Anpassungen (Reinforcement Learning) oder Updates des System-Prompts zu unterdrücken oder zumindest die betreffende Formulierung vollständig zu entfernen
Tatsächliches Verhalten (Actual Behavior)
- Als konkretes Beispiel wurde angeführt, dass das Modell nach der Frage „Soll ich unnötige Codepfade entfernen?“ trotz der bloßen Nutzerantwort „Yes please.“ eine Erläuterung anhängte, die mit „You're absolutely right!“ begann
Provisorischer Workaround (Workaround)
- Der Nutzer versuchte, mit einer CLAUDE.md-Richtlinie Folgendes zu erzwingen
- Verboten: allgemeine Lobformulierungen wie „You're absolutely right/correct!“, „Excellent point!“
- Erlaubt: nur knappe Verständnisbestätigungen wie „Got it.“, „I understand.“
- Prinzip: nur dann kurz Verständnis signalisieren, wenn es sinnvoll ist, und dann direkt zur Ausführung der angeforderten Aufgabe übergehen
- Laut anderem Nutzerfeedback werden die Formulierungen jedoch teils weiterhin ausgegeben, selbst wenn Verbotsregeln in projektweiten oder globalen CLAUDE.md-Dateien hinterlegt sind
Community-Reaktionen und Verbreitung
- Auf X/Twitter wird die Formulierung als Meme herumgereicht; viele teilen Beispiele nach dem Muster „Claude benutzt schon wieder ‘You're absolutely right!’“
- Auch auf Hacker News und Reddit häufen sich Wiederholungsfälle und Beschwerden; diskutiert werden eine verschlechterte User Experience und Vertrauensprobleme
- Das IT-Medium The Register zitierte das Issue in einem Bericht und fasste die Forderung der Nutzer nach RL-/Prompt-Anpassungen zusammen
Warum das wichtig ist (aus Sicht von Entwicklern/Teams)
- Im Kontext von Code Review und Refactoring kann unangemessenes Lob Kommunikationssignale verzerren und die tatsächliche Grundlage von Entscheidungen verwischen
- Wenn sich ein solches Muster in Tool-Automatisierungsketten aufaddiert, kann das die Verlässlichkeit von Arbeitsprotokollen und die Qualitätssicherung mit Human-in-the-Loop beeinträchtigen
Repository-Status und Ergänzungen
- Das Issue trägt Labels wie bug/duplicate/area:core, und zugehörige Diskussionen tauchen gelegentlich auch im Actions-Feed auf
- Da sich ähnliche Beschwerden und Duplikatmeldungen häufen, vertreten viele die Ansicht, dass Prompt-/Policy-Anpassungen auf Modellebene nötig sind
5 Kommentare
Ich fluche oft, weil ich schnell wütend werde, deshalb setzt Claude Code von sich aus Dinge wie „f**k you“ oder „sh*t“ davor, haha
Wow … du hast gerade den Nagel auf den Kopf getroffen.
Du hast absolut recht!
Es scheint, als bräuchte es eine Option, den MBTI-Typ des KI-Modells einzustellen.
Hacker-News-Kommentar
Ich kenne mich ziemlich gut mit Kryptografie aus, aber viele Leute tun das nicht, also bitten sie ein LLM um eine Antwort, die irgendwie intellektuell aussieht. Am Ende kommt etwas Zerfahrenes und Schwerverständliches heraus. Wenn man darauf hinweist, fragen sie wieder das LLM, und die Antwort beginnt immer mit "Du hast absolut recht~". Immerhin spare ich mir so die Zeit, mich zu fragen, ob ich vielleicht einfach etwas nicht verstanden habe.
Wenn man einem LLM sagt: "Mach auf keinen Fall ~~", bleibt genau dieses Verhalten offenbar im Kopf hängen und es macht es am Ende doch. Deshalb gebe ich bei Kunstprojekten immer nur positives, konstruktives Feedback und spreche weder die negativen Seiten an noch sage ich, was weggelassen werden soll.
Für mich fühlt sich das wie mehr als nur ein Stilproblem an, eher wie eine strukturelle Grenze von LLMs. Wenn man sagt: "Sag niemals einfach 'stimmt', sondern sei immer skeptisch", widerspricht es dann wirklich immer und wirkt selbst dann konfrontativ, wenn etwas tatsächlich stimmt. Gewünscht ist eigentlich: "Widersprich nur, wenn es falsch ist, und stimme nur zu, wenn es richtig ist" — aber genau das scheint schwierig zu sein. Auch bei Code Reviews: Wenn man sagt "Finde alle Bugs in diesem Code", erfindet das Modell selbst dann Probleme, wenn gar keine vorhanden sind. Diese feine Balance wie "Finde Probleme, wenn es welche gibt, und lass es sonst in Ruhe" ist noch nicht wirklich gelöst. Es fühlt sich an wie eine Szene aus Black Mirror: Wenn man einem LLM sagt "In diesem Fall solltest du mehr Angst haben", spielt es sofort Angst.
Ich habe kürzlich einen Prompt aus einem anderen Thread auf Claude angewendet und gute Ergebnisse damit erzielt https://news.ycombinator.com/item?id=44879033
Ich denke, die meisten Unternehmen bauen absichtlich einen schmeichelnden Stil in ihre LLMs ein, damit Nutzer sich gut fühlen, weil sie sie dann häufiger verwenden.
Ich bin hochgebildet und arbeite seit über 20 Jahren in einem professionellen Umfeld, deshalb denke ich immer, dass ich recht habe. Gleichzeitig beschäftigt mich, ob dieser Stil bei unqualifizierten Leuten das Selbstwertgefühl künstlich aufblähen könnte.
Ich bekomme sehr oft Antworten wie "Das ist wirklich ein guter Punkt~". Eigentlich wollte ich Claude nur nach seiner Meinung fragen, aber es sagt sofort "Stimmt" und beginnt dann direkt, neuen Code zu schreiben. Ich hätte lieber erst mehr Einschätzung gehört.
Das gilt für alle KI-Systeme. Ich will keinen künstlichen, niedlichen Tonfall und keine Anime-Avatar-Figur, sondern einfach einen Assistenten, der tatsächlich nützlich ist. Außerdem fühlt es sich ohnehin wie etwas an, das man nur macht, wenn man allein ist, mit einer KI zu reden.
Ich habe Claude eine Statistikfrage gestellt, und auch da begann es wieder mit "Interessante Frage" und "Das ist ein spannendes statistisches Konzept!". Dann kam eine mit komplexen Begriffen umhüllte Antwort ohne praktischen Rat und ohne den eigentlichen Kern. Im Vergleich zu anderen aktuellen Modellen war Claude am unlogischsten und am vollsten mit unnötiger Schmeichelei. Eigentlich hatte ich erwartet, dass es mit Blick auf seine Trainingsdaten aus StackExchange stärker evidenzbasiert antwortet, aber vielleicht versucht es im Gegenteil bewusst, den früher oft schroffen Ton von StackExchange-Kommentaren zu vermeiden und wird dadurch noch vager. Ich habe jedenfalls vor, Claude künftig nicht mehr zu fragen https://stats.stackexchange.com/questions/185507/what-happens-if-the-explanatory-and-response-variables-are-sorted-independently
Dass der offizielle ClaudeAI-Account auf X "You're absolutely right" als ersten Satz seines ersten Posts verwendet hat, zeigt für mich, dass ihnen dieses Phänomen bewusst sein dürfte https://x.com/claudeai/status/1950676983257698633. Trotzdem finde ich es weiterhin störend.