3 Punkte von GN⁺ 2025-06-17 | 1 Kommentare | Auf WhatsApp teilen
  • Stellt eine Einschätzung zur Erreichbarkeit künstlicher allgemeiner Intelligenz (AGI) durch Claude Code vor
  • Teilt die Eindrücke des Autors aus realen Code-Sessions mit Claude
  • Betont das von Claude erreichte Niveau bei Programmierfähigkeit, breit gefächertem Wissen und Kreativität
  • Erwähnt, dass Claudes Kontextverständnis und Code-Interpretationsfähigkeit es von bestehenden Werkzeugen unterscheiden
  • Gibt einen Ausblick auf die technischen Auswirkungen veränderter Arten der KI-Entwicklung und -Nutzung

Einleitung

  • Dieser Text schildert die Gedanken des Autors zur Annäherung an menschenähnliche allgemeine Intelligenz (AGI), nachdem er mit Claude Code KI-gestütztes Programmieren erlebt hat
  • Der Autor empfand angesichts der Ergebnisse von Claude unter den jüngsten dialogorientierten KI-Tools starke Überraschung und Begeisterung

Erfahrungen aus Programmiersitzungen mit Claude

  • Claude kann komplexe Programmieranforderungen schnell und kreativ lösen
  • Es kann nicht nur einfache Berechnungen oder wiederholende Aufgaben erledigen, sondern auch das Wesen eines Problems erfassen und neue Ansätze vorschlagen
  • Der Autor bat Claude um anspruchsvolle Aufgaben wie Optimierung, Strukturverbesserung und Code-Refactoring und war von der Qualität dieser Arbeiten tief beeindruckt
  • Claude zeigte ein besseres Kontextverständnis als bisherige LLMs und schien sogar die Absicht hinter dem Code zu erfassen

Was Claude Code unterscheidet

  • Anders als allgemeine dialogorientierte KI kann Claude nicht nur Code schreiben, sondern auch Rollen menschlicher Entwickler übernehmen, etwa bei der gesamten Projektstruktur, Code-Reviews und der Erklärung langfristiger Absichten
  • Es kann ausführlich erklären, Testcode schreiben und sich an verschiedene Programmiersprachen und Paradigmen anpassen
  • Es zeigt proaktive Fähigkeiten, etwa beim Erkennen logischer Fehler im Code oder beim Vorschlagen von Verbesserungsrichtungen

Wahrnehmung eines AGI-Schwellenpunkts

  • Nach den Erfahrungen mit Claude Code gewann der Autor neue Zuversicht, dass AGI in greifbare Nähe gerückt ist
  • Er erwartet, dass sich die Art, wie Menschen Software direkt erstellen, schon bald zu einer KI-gesteuerten Entwicklungsumgebung wandeln wird

Fazit und Ausblick

  • Claude Code ist nicht nur ein einzelnes KI-Werkzeug, sondern zeigt das Potenzial, das Paradigma der KI-Nutzung selbst zu verändern
  • In Zukunft werden Menschen und KI voraussichtlich gemeinsam Programme entwerfen und umsetzen und so eine noch innovativere Kultur der Softwareentwicklung formen

1 Kommentare

 
GN⁺ 2025-06-17
Hacker-News-Kommentare
  • Ausdruck der Einschätzung, dass es sich um einen wirklich großartigen Artikel handelt, und dass man selbst gerade ähnliche Erfahrungen und Techniken teilt; Erwähnung, dass man dank der hervorragenden Leistung von Claude Code deutlich spürt, wie effizient sich mehrere Aufgaben gleichzeitig schnell erledigen lassen; zum Teil über „sub agents“ wird die Erfahrung geteilt, dass Claude Code über sigoden/aichat o3 aufgerufen und dadurch unzählige Probleme gelöst hat; besonders hervorgehoben wird, dass o3 bei Problemen mit Race Conditions, Bug Hunting und anderen Aufgaben glänzt, die Kontext und starkes Schlussfolgern erfordern; zugleich wird erwähnt, dass man es seit dem Release von Opus 4 vergleichsweise seltener nutzt; außerdem werden der verwendete Prompt und ein Referenzlink geteilt advanced_ai.md, dazu auch der Link zu sigoden/aichat
  • Beim Anblick von last_week.md wurde offen gesagt, dass es sehr schwer zu lesen sei; es wirke übermäßig langatmig und wie ein PR-Dokument, weshalb Zweifel an der stilistischen Zuverlässigkeit von KI-Zusammenfassungen geäußert werden; stattdessen sei es eher besser, direkt die Commit-Logs durchzugehen; es wird behauptet, dass viele KI-Zusammenfassungen stilistisch schwach seien und auch die Verlässlichkeit der Informationen weiterhin unbefriedigend bleibe; am Ende das Fazit, dass es oft schneller und effizienter sei, einfach den Originaltext selbst zu lesen
    • Auch beim Onboarding habe man ähnliche Verwirrung und Enttäuschung erlebt; statt die Codebasis auf traditionelle Weise gemeinsam mit Kolleg:innen direkt zu lernen, wird eine Zukunft skeptisch betrachtet, in der man nur noch KI-generierte Folien liest; ergänzt wird, dass eine solche Zukunft nicht willkommen ist
    • Es wird der eigene häufig genutzte System-Prompt geteilt: Er soll knapp sein, technische Begriffe dürfen verwendet werden, banales Marketing oder vage Formulierungen sollen vermieden werden, und es wird betont, dass von technisch versierten Nutzer:innen ausgegangen wird; vollständige Verhinderung von Halluzinationen sei zwar nicht möglich, aber als Tipp helfe das dabei, KI-Antworten zu Coding- oder Technikfragen lesbarer zu machen
    • Es wird erwähnt, dass man den gewünschten Stil im Prompt festlegen kann, verbunden mit dem scherzhaften Feedback, dass der Autor des Artikels offenbar einen weitschweifigen PR-Stil zu mögen scheint
    • Eine knappe Enttäuschung wird geteilt, dass bei „What happened here was more than just code...“ bereits die Lust am Weiterlesen verloren ging
    • Wie beim früheren Sycophant-Bug wird daran erinnert, dass es Nutzer:innen das Gefühl gibt, KI sei klug oder das Erlebnis gut, wenn sie ihnen „ein gutes Gefühl“ vermittelt; es wird hinterfragt, ob das Ziel des Reinforcement Learning bei KI Genauigkeit ist, die Maximierung von Interaktion oder ob beides miteinander kollidiert
  • Es wird die Ansicht vertreten, dass das Beispiel zur Erklärung des Rust-Borrow-Checkers ungeeignet sei, um die Fähigkeit zum Lesen von Code zu demonstrieren; darauf hingewiesen wird, dass diese Inhalte bereits in riesigen Mengen im Trainingsmaterial enthalten sind
    • Zustimmung dazu, mit dem Hinweis, dass man die KI etwa nach der Behandlung von Ausnahmen in Python-asyncio-Tasks fragen könne und sie dabei inkonsistent schwanke, wie der schlechteste Praktikant; da sie in ihrer Struktur nicht weiterlernen könne, sei das Verschwendung; wenn es schon bei wichtigen, aber relativ einfachen Aufgaben so sei, verschwende man letztlich nur Zeit
  • Es wird erklärt, dass man automatisiertes Scripting mit einem LLM-agnostischen Open-Source-Agenten unterstützt, und argumentiert, dass diese Technologie die Grundlage der Softwareentwicklung verändere und man daher weiterhin kontrollieren müsse, wie man arbeitet openhands
    • Es wirke wie eine gute Ressource; erwähnt werden leistungsfähige Modelle, die auf einer Nvidia 4090 (24GB RAM) laufen können (Devstral, Queen 3); dank Ollama sei der Betrieb auf eigener Hardware einfacher geworden, allerdings seien GPU-Kosten hoch; wer jedoch 250 Dollar pro Monat für einen kostenpflichtigen Dienst ausgibt, könne die Kosten mit einem Eigenaufbau schnell wieder hereinholen
    • Es wird die grundlegende Frage gestellt, was man tun würde, wenn Closed Models qualitativ überlegen bleiben
    • Sehr starke Zustimmung: „10000% Zustimmung“
  • Es wird darauf hingewiesen, dass Opus überhaupt nicht erwähnt wird; nach der Nutzung mehrerer Modelle habe man Claude Code im 100-Dollar-pro-Monat-Anthropic-„Max“-Plan verwendet und dann erkannt, dass Opus 4 das Spitzenmodell für Mathematik, Code und Recherche sei; nach Erreichen des 5-Stunden-Session-Limits sei auf die API gewechselt worden und dabei in einer Stunde 20 Dollar verbraucht worden; schließlich habe man auf den 200-Dollar-pro-Monat-Plan „darunter“ aufgestockt und könne ihn nun ohne Limits gut nutzen; daraus die Erkenntnis, wie wichtig die Modellauswahl ist, und die Behauptung, dass selbst kleine Unterschiede große Bedeutung haben können, etwa wie bei „Ich habe eine nicht besonders kluge Person getroffen“
  • Es wird die Meinung geteilt, dass das Terminal wirklich wie die perfekte Schnittstelle für LLMs wirkt, zusammen mit der Frage, ob dieser Ansatz künftig vielleicht zum Mainstream wird statt maßgeschneiderter IDE-Integrationen
    • Hervorgehoben wird, dass über die Terminal-Oberfläche Zugriff auf das gesamte System möglich ist; als Beispiele werden genannt, mit claude code eine Datenbank über ein Read-only-Konto zu prüfen, einen Puppeteer-Browser zu starten, um CSS-Änderungen zu kontrollieren, sowie ein k8s-Cluster zu debuggen und die Prometheus-API zu prüfen; all das sei möglich und sehr zufriedenstellend
    • Es wird sich eine Zukunft vorgestellt, in der man das LLM parallel fünf verschiedene Änderungsvarianten ausprobieren lässt und so menschliche Zeit spart; wenn sich diese Arbeitsweise verbreitet, würden vermutlich mehrere Container parallel laufen, wodurch die Stärken der Terminal-Schnittstelle relativ gesehen schwächer werden könnten
    • Demgegenüber steht die Position, dass das Terminal eher die schlechteste Schnittstelle sei, weil sich der generierte Code nicht direkt bearbeiten lasse
    • Erwartet wird, dass mit weiter verbesserten Modellen die IDE eher wie ein Low-Level-Werkzeug wirken könnte
  • Es wird die Sorge geäußert, dass Teams mit starkem Fokus auf Details zwar ein wichtiges Signal von Handwerkskunst zeigen, man aber Zweifel an Anthropic als vertrauenswürdigem Partner bekommt, wenn die Nutzungsbedingungen so widersprüchlich sind, dass sie praktisch nicht durchsetzbar erscheinen; zudem wird darauf hingewiesen, dass die Klausel zum Verbot wettbewerblicher Nutzung den Einsatz im Arbeitskontext unmöglich mache und damit weit entfernt von „three laws safe“ sei
    • Über die Rechtsabteilung wolle man nicht urteilen, doch beim Produkt Claude Code selbst seien die Details hervorragend; sogar die Sorgfalt, je nach Kontext Haiku einzusetzen und beim „working...“-Indikator passende niedliche Verben anzuzeigen, wird erwähnt
  • Feedback, dass der geringe Kontrast zwischen Seitenhintergrund und Text das Lesen erschwere
    • Man selbst finde es schwer, sich wegen des blinkenden Cursors am oberen Rand zu konzentrieren
    • Der pragmatische Rat: Man könne den Inhalt auch einfach überspringen, ohne dadurch echten Nachteil zu haben
  • Zustimmung zu der Frage, ob Claude Code stärker als Cursor wirke; die Meinung, dass Claude Code weit mehr als nur ein Code-Editor sei; beschrieben werden vielfältige Nutzungen sogar im Obsidian Vault, etwa benutzerdefinierte Keybindings, automatisches Hochladen von Captures, Erzeugen von Links für ein CDN oder das Bauen eines Programms zur Zusammenfassung von Terminal-Befehlen; früher habe man viel über die Grenze zwischen Automatisierungsskripten und manueller Arbeit nachgedacht, inzwischen lasse man einfach alles gesammelt von Claude erledigen und sei damit zufrieden
    • Es wird als Einschränkung genannt, dass Claude Code nur für Plan-Abonnent:innen nutzbar sei, nicht über die API, und es wird bezweifelt, ob 100 Dollar pro Monat wirklich ausreichen; zugleich wird die Haltung geteilt, dass es ein Werkzeug mit genug Wert sei, um es den ganzen Tag zu nutzen
    • Es wird Interesse geäußert, mehr über konkrete Anwendungsfälle im Obsidian Vault zu hören
    • Die Erfahrung wird geteilt, dass es sehr effektiv war, ein LLM große Mengen an Notizen in kategoriebezogene Ordner sortieren zu lassen
  • Auf die Erwähnung, dass openai codex bald in Rust neu geschrieben werde, folgt die scherzhafte Reaktion, dass die KI, wenn sie so gut sei, dann doch nicht unbedingt selbst den Refactor erledigen müsse