32 Punkte von GN⁺ 2025-05-01 | 5 Kommentare | Auf WhatsApp teilen
  • gpt-4.1 ist ein vorsichtiger und verlässlicher Helfer mit Stärken beim präzisen Codeverständnis und einem konservativen Ansatz
  • gemini 2.5 pro ist hervorragend bei der Verarbeitung großer Kontexte und auch bei der Bildanalyse, birgt aber das Risiko übermäßiger Änderungen
  • sonnet 3.5/3.7 ist kreativ und intelligent, schwächelt jedoch bei Kontexttreue und Konsistenz, sodass es in langen Gesprächen ins Wanken gerät
  • grok-3-beta ist langsam, zeigt aber außergewöhnliches Potenzial bei der Design-Visualisierung und beim Lösen komplexer Probleme
  • Nutzer setzen Modelle je nach Workflow getrennt ein und bevorzugen bei fehlgeschlagenem Debugging Strategien mit Checkpoint-Wiederherstellung und Modellwechsel

gpt-4.1

  • Verhält sich wie ein intelligenter und hochzuverlässiger Assistent
  • Urteilt nicht vorschnell, folgt Anweisungen, nimmt aber keine übertriebenen Änderungen vor
  • Fühlt sich wie eine Erweiterung des Entwicklers an und eignet sich besonders für erfahrene Entwickler

gemini 2.5 pro

  • Stark, wenn breiter Kontext wie lange Konsolen-Logs oder ganze Codedateien genutzt wird
  • Hervorragende Bildanalysefähigkeiten, kann visuelle Fehler erkennen
  • Der Nachteil ist, dass es zu autonom arbeitet und dadurch unnötige Code-Löschungen oder übermäßige Änderungen verursachen kann
  • Erfordert sorgfältige Steuerung

sonnet 3.5 / 3.7

  • 3.7 ist kreativ und intelligent, kann in langen Gesprächen aber den Kontext verlieren oder Anweisungen ignorieren
  • 3.5 ist stark beim Verstehen und Bearbeiten von Code auf Basis einzelner Dateien
  • Aufgrund von Übergangsproblemen bei der Integration mit Cursor zeigt es keine konsistent stabile Leistung

Weitere Meinungen und Strategien

  • grok-3-beta ist langsam, aber nützlich, um Probleme zu lösen, an denen andere Modelle gescheitert sind
  • Ein Nutzer verwendet folgende Strategie zur Arbeitsteilung zwischen Modellen:
    • o3/4-mini: Strukturierung der Planung und ordnen von Überlegungen in Markdown
    • gemini 2.5 pro: Analyse von Problemen auf Basis ganzer Dateien und für Function Calling
    • sonnet 3.5: für dateibasierte Einzeldatei-Änderungen mit cmd+k

5 Kommentare

 
bungker 2025-05-02

Man kann mit Sicherheit sagen, dass Gemini 2.5 Pro für Go die absolute Spitzenklasse ist.

 
daddy 2025-05-02

Ich empfehle JanimAI für Frage-und-Antwort-Anwendungen, weil es am schnellsten ist.

 
jk34011 2025-05-02

Ich habe bisher hauptsächlich Sonnet verwendet,
aus dem Haupttext kann ich vieles gut nachvollziehen.
Dann sollte ich wohl auch 4.1 ausprobieren.

 
gnoopy 2025-05-01

Das entspricht ziemlich meinem Eindruck. Bei Sonnet wurde ich mit der Zeit immer unsicherer, während man sich bei ChatGPT 4.1 trotz einer Anweisung erst einmal eher beruhigt zurücklehnen kann.

Auch die Einschätzung zu Grok kann ich nachvollziehen, aber ich nutze es eher, um Dinge im Chat in Ruhe zu prüfen, als direkt in der IDE.

 
GN⁺ 2025-05-01

Reaktionen der Reddit-Community

Wie die Modelle genutzt werden

  • o3/4-mini: für Planung und Markdown-basierte Organisation, mit besserem reasoning und Eignung für Dialoge (Masony817, scragz, Princekid1878)
  • gemini 2.5 pro:
    • nützlich im Agent-Modus oder für Function Calling auf Basis langer Kontexte (Masony817, computerlegs)
    • stark darin, bei komplexen Projekten den gesamten Code zu überblicken und zu beurteilen (WorryBubbly3438)
    • gut für Suche, Cross-Checking und Vorverarbeitung (computerlegs)
  • sonnet 3.5: stark beim Verstehen und Bearbeiten einzelner Dateien, gut geeignet für den Shortcut cmd+k (Masony817)
  • sonnet 3.7:
    • kreativer und besser als 3.5, hat aber in langen Gesprächen Probleme, den Faden zu behalten (Sea_Cardiologist_212)
    • stark bei aktuellerem Cutoff-Wissen und Denkvermögen (yairEO)
    • stabil, wenn man gut mit dem Kontextfenster umgeht (computerlegs)
  • Claude 3.7: in der Cursor-Umgebung stabil und konsistent (cmndr_spanky)
  • gpt-4.1:
    • geeignet für einfache Routineaufgaben oder strukturierte Arbeiten (Princekid1878, ILikeBubblyWater)
    • neigt dazu, ohne Erklärung zu viel zu verändern (ILikeBubblyWater)
  • Deepseek R1: funktioniert bei bestimmten Problemen überraschend besser als andere Modelle (Leather_Science_7911)

Nutzungsstrategien und Workflows

  • Rollen auf verschiedene Modelle aufteilen und je nach Situation wechseln (mehrere Meinungen)
  • cmd+k: Bearbeitung einzelner Dateien mit sonnet 3.5 (Masony817)
  • Agent-Modus: nach der Ersteinrichtung nicht mehr genutzt, stattdessen Checkpoint-Funktion und klare Prompts (WorryBubbly3438)
  • Auto mode wird bevorzugt: schnell und kostengünstig ausführbar (Funny-Anything-791, d0RSI)
  • Mechanischer Ansatz: explizite und präzise Anweisungen sind wichtig, wie bei einer CNC-Maschine (Funny-Anything-791)
  • Spezialisierte Modelle für UI- und Design-Tests sind noch unzureichend (Princekid1878)

Weitere Meinungen

  • Beschwerden, dass Sonnet 3.7 im Vergleich zu früher bei Fokus und Kontextwahrung nachgelassen habe (Sea_Cardiologist_212)
  • Gemini oder Claude wirken in Testvideos gut, in realen Umgebungen aber anders (cmndr_spanky)
  • Bei den meisten Modellen sind explizite Prompts entscheidend (häufige Aussage)
  • Einige Nutzer erwarten Krypto- oder Web-basierte Integrationen (indirekt erwähnt)