AGI mit Claude Code inhalieren

(kadekillary.work)

3 Punkte von GN⁺ 2025-06-17 | 1 Kommentare | Auf WhatsApp teilen

Stellt eine Einschätzung zur Erreichbarkeit künstlicher allgemeiner Intelligenz (AGI) durch Claude Code vor
Teilt die Eindrücke des Autors aus realen Code-Sessions mit Claude
Betont das von Claude erreichte Niveau bei Programmierfähigkeit, breit gefächertem Wissen und Kreativität
Erwähnt, dass Claudes Kontextverständnis und Code-Interpretationsfähigkeit es von bestehenden Werkzeugen unterscheiden
Gibt einen Ausblick auf die technischen Auswirkungen veränderter Arten der KI-Entwicklung und -Nutzung

Einleitung

Dieser Text schildert die Gedanken des Autors zur Annäherung an menschenähnliche allgemeine Intelligenz (AGI), nachdem er mit Claude Code KI-gestütztes Programmieren erlebt hat
Der Autor empfand angesichts der Ergebnisse von Claude unter den jüngsten dialogorientierten KI-Tools starke Überraschung und Begeisterung

Erfahrungen aus Programmiersitzungen mit Claude

Claude kann komplexe Programmieranforderungen schnell und kreativ lösen
Es kann nicht nur einfache Berechnungen oder wiederholende Aufgaben erledigen, sondern auch das Wesen eines Problems erfassen und neue Ansätze vorschlagen
Der Autor bat Claude um anspruchsvolle Aufgaben wie Optimierung, Strukturverbesserung und Code-Refactoring und war von der Qualität dieser Arbeiten tief beeindruckt
Claude zeigte ein besseres Kontextverständnis als bisherige LLMs und schien sogar die Absicht hinter dem Code zu erfassen

Was Claude Code unterscheidet

Anders als allgemeine dialogorientierte KI kann Claude nicht nur Code schreiben, sondern auch Rollen menschlicher Entwickler übernehmen, etwa bei der gesamten Projektstruktur, Code-Reviews und der Erklärung langfristiger Absichten
Es kann ausführlich erklären, Testcode schreiben und sich an verschiedene Programmiersprachen und Paradigmen anpassen
Es zeigt proaktive Fähigkeiten, etwa beim Erkennen logischer Fehler im Code oder beim Vorschlagen von Verbesserungsrichtungen

Wahrnehmung eines AGI-Schwellenpunkts

Nach den Erfahrungen mit Claude Code gewann der Autor neue Zuversicht, dass AGI in greifbare Nähe gerückt ist
Er erwartet, dass sich die Art, wie Menschen Software direkt erstellen, schon bald zu einer KI-gesteuerten Entwicklungsumgebung wandeln wird

Fazit und Ausblick

Claude Code ist nicht nur ein einzelnes KI-Werkzeug, sondern zeigt das Potenzial, das Paradigma der KI-Nutzung selbst zu verändern
In Zukunft werden Menschen und KI voraussichtlich gemeinsam Programme entwerfen und umsetzen und so eine noch innovativere Kultur der Softwareentwicklung formen

1 Kommentare

GN⁺ 2025-06-17

Meinungen auf Hacker News

Ich bin zwar voreingenommen [0], aber ich denke, man sollte rund um Open-Source-Agenten skripten, die nicht von einem bestimmten LLM abhängig sind.
Diese Technologie verändert die Grundlage der Softwareentwicklung, also sollten wir dafür sorgen, dass wir weiterhin kontrollieren können, wie wir arbeiten.

[0] https://github.com/all-hands-ai/openhands
- Sieht nach gutem Material aus. Es gibt ziemlich leistungsfähige Modelle, die man auf einer Nvidia 4090 24GB laufen lassen kann, darunter auch Devstral und Qwen 3.
  Mit Ollama kann man sie leicht auf eigener Hardware ausführen, aber die GPU-Kosten sind eine große Investition. Wenn man allerdings 250 Dollar im Monat für proprietäre Tools zahlt, kann sich das recht schnell amortisieren.
- Was, wenn die geschlossenen Modelle einfach besser sind?
Der Artikel ist etwas sprunghaft. Zunächst einmal ist ein Slide Deck nicht besonders nützlich, um eine Codebasis zu erklären.
Es gibt einen Grund, warum Leute Slide Decks kaum für etwas anderes verwenden als zur Unterstützung mündlicher Präsentationen. Das meiste, was im Artikel steht, sind keine neuen Fähigkeiten, und Workflow-Automatisierung ist eindeutig wertvoll und cool, aber ich sehe nicht, was AGI hiermit zu tun hat.
- Außerdem ist es nicht vertrauenswürdig. Ich glaube, der Artikel spricht das auch ein wenig an; ich habe ihn nur überflogen.
  Man sollte kein LLM brauchen, um eine Codebasis zu verstehen. Man sollte sie einfach verständlicher machen. Natürlich liebt Kapital Abkürzungen und Hacks, um in Q3 das nächste Feature auszuliefern.
- Der nützlichste Einsatz von LLMs war für mich, mermaidjs-Diagramme des Codes zu erstellen.
  Ich weiß, dass sie nicht immer perfekt sind, aber sie waren mehrfach „gut genug“, und ich habe dabei keine Halluzinationen gesehen, nur Auslassungen. Wenn man sieht, dass etwas fehlt, ist es auch sehr einfach zu sagen, dass es korrigiert werden soll.
- Dem Ton des Artikels nach wird AGI eher scherzhaft verwendet, und der Autor scheint sich selbst nicht allzu ernst zu nehmen, was erfrischend ist.
  Natürlich wäre es nicht erfrischend, wenn der Artikel keine nützlichen Informationen enthielte, aber ich denke tatsächlich, dass Slide Decks zum Verständnis einer Codebasis nützlich sein könnten. Es ist ein „nice to have“, für das man keinen Junior Zeit aufwenden lassen möchte, aber wenn für etwa 5 Dollar ein einigermaßen nützliches Ergebnis herauskommt, ist das ziemlich gut.
  Ein Teil des gedanklichen Wandels durch LLM-Nutzung besteht darin, Dinge neu zu betrachten, die man früher nicht mochte, weil der Aufwand im Verhältnis zum Wert zu groß war. Wenn ich es nicht selbst machen oder die Zeit und Nerven eines Teammitglieds verbrennen muss, sagt man eher: „Okay, geh die Codebasis durch und schreibe alle Features und Anforderungen als tabellarisches Markdown-Dokument auf. Vielleicht klappt es besser als erwartet, und wenn nicht, machen wir eben etwas anderes.“
Guter Artikel. Ich mache ähnliche Beobachtungen und nutze ähnliche Techniken, und Claude Code ist außergewöhnlich gut.
Heutzutage arbeite ich dank git worktree an den meisten Tagen an mehreren Dingen gleichzeitig, und jedes davon geht viel schneller als früher, was sich wirklich seltsam anfühlt.
Beim Teil zu „Sub-Agenten“ muss ich zugeben, dass mich die Konfiguration, in der Claude Code über sigoden/aichat o3 aufruft, unzählige Male gerettet hat.
Es gibt Probleme, bei denen o3 besonders gut ist: Race Conditions, Bugs finden – Dinge, die viel Kontext und sehr hohe Schlussfolgerungsfähigkeit erfordern.
Seit Opus 4 erschienen ist, nutze ich es allerdings weniger, und natürlich ist das überhaupt kein Sub-Agent im eigentlichen Sinne.
Ich verwende diesen Prompt per @include in der Hauptdatei CLAUDE.md: https://github.com/pgflow-dev/pgflow/blob/main/.claude/advan...

sigoden/aichat: https://github.com/sigoden/aichat
- Moment, was? Wie arbeitet man mit git worktree an mehreren Dingen gleichzeitig?
Das Terminal scheint eine nahezu perfekte Schnittstelle für LLMs zu sein. Ich frage mich, ob dieser Ansatz gegenüber maßgeschneiderten IDE-Integrationen bevorzugt werden wird.
- Stimmt. Es hat Zugriff auf buchstäblich alles, einschließlich MCP-Servern. Es ist wirklich großartig, wenn Claude Code mit einem Read-only-User in die Datenbank schaut oder einen Puppeteer-Browser öffnet, um zu prüfen, ob eine CSS-Änderung seltsam aussieht.
  Es ist eine perfekte Schnittstelle, und Anthropic hat sie richtig umgesetzt.
  Es kann mit kubectl-Befehlen meinen k8s-Cluster debuggen und über die API Prometheus abfragen – wie cool ist das bitte?
- Bis zu einem gewissen Grad ja, aber ich denke, die Zukunft von LLMs wird dahin gehen, 5 separate Versuche parallel laufen zu lassen, um einen Fix zu erstellen, weil LLM-Zeit billiger ist als Menschenzeit.
  Wenn dieses Element in den Workflow kommt, wird man mehrere Container hochfahren wollen, und dann wird der Vorteil des Terminals schwächer.
- Je besser die Modelle werden, desto mehr wird die IDE wie ein Low-Level-Tool wirken.
- Wie bitte? Das Terminal ist buchstäblich die schlechteste Schnittstelle.
  Willst du den Code nach der Generierung etwa nicht direkt bearbeiten?
Den Rust-Borrow Checker erklären zu lassen, ist eines der schlechtesten Beispiele, um Code-Lesefähigkeit zu demonstrieren. Dazu gibt es in den Trainingsdaten Unmengen.
- Zustimmung. Wenn man es erklären lässt, wie Exceptions in Python-asyncio-Tasks behandelt werden, schwankt es – selbst wenn man ihm den gesamten Code gibt – wie der schlechteste Praktikant der Welt.
  Außerdem gibt es keine Möglichkeit, es zu „lehren“, und selbst wenn, bleibt es nicht über den aktuellen Kontext hinaus erhalten.
  Für wichtige, aber relativ einfache Aufgaben ist es reine Zeitverschwendung.
- Die Beschwerde „Dazu gibt es in den Trainingsdaten Unmengen“ ist seltsam.
  Wenn mir jemand den Rust-Borrow-Checker erklärt, soll ich das dann nicht gelten lassen, weil diese Person schon einmal Erklärungen zum Borrow Checker gelesen hat, und mich beschweren, dass es „in den Trainingsdaten war“? Glaubt man, den Borrow Checker zu verstehen, ohne ihn in irgendeiner Form gelernt zu haben?
  Ich verstehe in etwa, worauf du hinauswillst: Es gibt nicht viele Belege dafür, dass solche Tools neue Ideen hervorbringen können, und wegen der enormen Wissensmenge ist dieses Phänomen schwer zu erkennen. Aber praktisch gesehen ist es selbst innerhalb des Rahmens von Halluzinationen nützlich und hilfreich, daher stört es mich nicht besonders.
Wenn Aufmerksamkeit fürs Detail eines der besten Anzeichen dafür ist, dass einem Handwerkskunst wichtig ist: Ist dann die Tatsache, dass die rechtlichen Bedingungen von Anthropic logisch nicht erfüllbar sind, kein schlechtes Zeichen dafür, ihnen als sorgfältigen Verwaltern von ASI zu vertrauen?
Wenn man es nicht beruflich nutzen kann, ohne gegen das Verbot kompetitiver Nutzung zu verstoßen, wirkt das nicht gerade „auf dem Sicherheitsniveau der drei Robotergesetze“.
- Zur Rechtsabteilung kann ich nichts sagen, aber das Produkt Claude Code zeigt Spuren von großzügiger Liebe zum Detail.
  Bis hin dazu, dass im Kontext Haiku ausgeführt wird, um für den „working…“-Indikator niedliche und passende Verben zu erzeugen.
claude --dangerously-skip-permissions # science mode

Darüber musste ich lachen.
Stimme zu. Claude Code fühlt sich leistungsfähiger an als Cursor, und einer der Gründe scheint die Skriptfähigkeit zu sein.
Letztlich ist Cursor ein Editor, während Claude Code ein Schweizer Taschenmesser auf Steroiden ist.
Ich nutze Claude Code oft auch außerhalb klassischer Codebases. Ich lasse es in meinem Obsidian-Vault für alle möglichen Dinge laufen, lasse es Skripte für lokale Custom-Keybindings schreiben, die Screenshots auf mein CDN hochladen und mir einen Markdown-Link geben, oder Programme bauen, die mit Ollama kommunizieren, um die Terminal-Befehle des vergangenen Tages zusammenzufassen.
Früher musste ich abwägen, ob es sich lohnt, eine Änderung an Dateiformaten zu skripten, oder ob ich sie manuell mache. Jetzt starte ich einfach Claude in dem entsprechenden Verzeichnis und lasse es das erledigen. Es ist wirklich für viele Dinge nützlich.
- Das Problem ist, dass Claude Code nur mit einem Abo funktioniert.
  Über die API kann man es nicht nutzen, deshalb frage ich mich, ob 100 Dollar im Monat wirklich ausreichen. Inzwischen benutze ich es den ganzen Tag, jeden Tag, und ich habe das Gefühl, dass ich deutlich mehr verbrauche, als meine 100 Dollar abdecken.
- Ich bin wirklich neugierig, wofür du es in deinem Obsidian-Vault verwendest.
- Wie skriptest du Claude Code? Ich habe es über die CLI genutzt, aber nie daran gedacht, Claude Code aus einem Skript aufzurufen. Klingt ziemlich interessant.
- Vor ein paar Tagen habe ich ein LLM eine riesige Menge meiner Notizen in Kategorieordner einsortieren lassen. Meine Güte, das war wirklich hilfreich.
Nebenbei: Wegen des Kontrasts zwischen Hintergrund und Schrift ist das hier wirklich schwer zu lesen.
- Bei mir liegt es am blinkenden Cursor ganz oben. Es ist schwer, sich auf den Text zu konzentrieren.
- Man verpasst nicht viel, wenn man es einfach überspringt.
Weder hier noch anderswo wird bisher Opus erwähnt.
Nachdem ich alles Mögliche ausprobiert hatte, bin ich beim 100-Dollar-„Max“-Monatsabo von Anthropic gelandet, um Claude Code zu nutzen. Dann habe ich festgestellt, dass Claude Opus 4 für meine aktuelle Situation – Mathe-Code und Forschung – das beste, aber auch teuerste Modell ist.
Ich bin an das Limit für 5-Stunden-Sessions gestoßen und auf die API gewechselt, wo ich in einer Stunde 20 Dollar verbrannt habe. Also bin ich auf „Max“ für 200 Dollar im Monat hochgegangen und bin bisher noch nicht wieder an Grenzen gestoßen.
Das Modell ist wichtig. Solche Geschichten klingen alle nach: „Ich habe jemanden getroffen, der nicht besonders schlau war.“ Natürlich.
- Das hier war alles mit Opus gemacht.

AGI mit Claude Code inhalieren

Einleitung

Erfahrungen aus Programmiersitzungen mit Claude

Was Claude Code unterscheidet

Wahrnehmung eines AGI-Schwellenpunkts

Fazit und Ausblick

Verwandte Beiträge

1 Kommentare

Meinungen auf Hacker News