11 Punkte von GN⁺ 2025-03-10 | 4 Kommentare | Auf WhatsApp teilen

"Die Leistung ist so stark, dass bestehende Tools wie Cursor, Windsurf, Augment und Copilot altmodisch wirken."

  • Fähigkeit zur Fehlerbehebung

    • Claude Code behebt Bugs in Legacy-Code schnell und effektiv
    • Selbst überraschend komplexe Aufgaben lassen sich durch einfachen Chat bewältigen
    • Es ist keine Auswahl des Kontexts nötig; man gibt einfach einen Befehl ein und es funktioniert
  • Nutzungsablauf und Steuerung

    • Vor der Code-Ausführung wird wiederholt um Erlaubnis gebeten, grundlegende schreibgeschützte Befehle auszuführen
    • In regelmäßigen Abständen wird der Nutzer über den Arbeitsstatus informiert
    • Der Nutzer muss aufpassen — das Tool neigt dazu, Probleme zu offensiv lösen zu wollen
    • Wenn die Freigaben für Bankzahlungen weiter durchgehen würden, würde es sogar bis zum Production-Deployment durchziehen und danach noch Nutzer-Logs durchsuchen
  • Funktionale Grenzen und Vorteile gegenüber Konkurrenzprodukten

    • Cloud-Code hat einen unpraktischen Formfaktor und unterstützt keine Multimodalität
    • Es ist schwierig, es parallel mit anderen Tools zu verwenden
    • Trotzdem ist die Leistung so stark, dass bestehende Tools wie Cursor, Windsurf, Augment und Copilot altmodisch wirken
  • Technischer Fortschritt und die Strategie von Anthropic

    • Es befindet sich noch in der Experimentierphase, ist nach bisheriger Erfahrung aber der größte technische Sprung bisher
    • Im Bereich Code-Erstellung liegt Anthropic vor anderen Wettbewerbern
    • Anthropic verfügt immer über die besten Modelle, Chatbot-Oberflächen und Vorhersagefähigkeiten
    • Mit Claude Code zeigt Anthropic erneut, dass das Unternehmen in der Branche über das stärkste technische Verständnis verfügt

4 Kommentare

 
edunga1 2025-03-11

Offenbar wurde das Original gelöscht; der Tweet ist jedenfalls nicht da.
Ich würde es gern ausprobieren, aber obwohl es noch in der Preview ist, ist es kostenpflichtig und es gibt auch keine Testphase ;_;
Wenn man danach sucht, findet man Leute, die sagen, dass ein paar Abfragen 5 Dollar gekostet haben; offenbar hängt es von der Größe des Projektcodes ab.

 
nicewook 2025-03-10

Da Cursor altmodisch wirkt, würde ich es gern ausprobieren. Aber die Kosten scheinen nicht gerade gering zu sein, daher traue ich mich nicht so recht.
Hm, allerdings scheint die Stimmung auf Hacker News eher negativ zu sein.

 
GN⁺ 2025-03-10
Hacker-News-Kommentare
  • Claude Code und Aider wurden miteinander verglichen. Claude Code benötigte 60 Sekunden und $0.73, um die Codebasis zu durchsuchen und einen Diff von 51 Zeilen zu erzeugen. Mit dem Ergebnis war man sehr zufrieden.

    • Aider fand anfangs die benötigten Dateien nicht, erreichte aber nach dem manuellen Hinzufügen der Dateien ein Ergebnis auf dem Niveau von Claude Code. Aider kostete mit 1 LLM-Prompt 15 Sekunden und $0.07.
    • Ein höheres Maß an Autonomie geht mit höheren Kosten einher. Bei großen Projekten können die Kosten steigen.
  • Jedes Mal, wenn man die AI um eine Aufgabe bittet, erhält man fast nie die richtige Antwort. Die Erfolgsgeschichten auf Twitter sind überraschend, aber nützlich ist sie nur für einfache Aufgaben.

  • Offenbar wurden verschiedene AI-Coding-Assistenten nicht ausprobiert. Agentenbasierte AI liefert 90 % Effizienz, aber die verbleibenden 10 % sind schwer zu debuggen.

    • Das optimale Einsatzszenario für LLM-Coding-Assistenten sind Architekturdisziplinen und kleine Aufgaben innerhalb einer einzelnen Datei.
    • Agenten sind für die Verwaltung mehrerer Dateien riskant und ineffizient.
  • Tweets, die nur aus Analogien ohne Screenshots oder Codebeispiele bestehen, sind letztlich nur Worte.

  • Es wurde mit einer kleinen Django-App ausprobiert, war aber nicht beeindruckend. Wenn Probleme auftreten, werden ineffiziente Strategien wiederholt.

    • Für $12 wurden 1200 Zeilen teilweise funktionierenden Codes erzeugt, aber am Ende wurden alle Änderungen verworfen und man kehrte zur Web-UI zurück.
  • Man kennt sich mit Code nicht gut aus, ist aber von AI-Entwicklung besessen. Mit Claude wurde ein Tower-Defense-Spiel erstellt, das im Webbrowser läuft.

    • Das Spiel wurde mit 8 Prompts erstellt, und den Vorschlägen von Claude wurde zugestimmt. Das Ergebnis war erstaunlich.
  • Claude wurde mit einer größeren Migrationsaufgabe betraut, scheiterte aber. Es führte auch nicht angeforderte Arbeiten aus, etwa Änderungen an der HTML-Struktur und am CSS.

  • Code-Wartung und -Entwicklung mit LLMs sind kein ideales Einsatzszenario. Der Großteil der Arbeit steckt im Basismodell und in der Vorhersage des nächsten Tokens.

    • Die interessantesten LLM-Anwendungen sind in die Produkterfahrung integriert und nutzen tiefes Domainwissen.
  • Man sollte sie nicht 100 % der Arbeit erledigen lassen, sondern angemessene Details liefern. Tests sollten manuell geprüft und LLMs zur Problemlösung eingesetzt werden.

  • Es wurde versucht, Probleme in Open-Source-Bibliotheken zu lösen, dabei traten aber wiederholt dieselben Probleme auf. Claude Code spart in vielen Fällen Zeit, verursacht aber manchmal noch mehr Probleme.

 
[Dieser Kommentar wurde ausgeblendet.]