DeepSeek Reasonix – DeepSeek-nativer Coding-Agent mit hoher Cache-Nutzung und niedrigen Kosten
(esengine.github.io)- Open-Source-Terminal-Coding-Agent, der ausschließlich für die DeepSeek API entwickelt wurde und direkt mit
api.deepseek.comkommuniziert - Die Append-only-Schleife ist für den byte-stabilen Prefix-Cache von DeepSeek optimiert, hält in langen Sitzungen eine Cache-Trefferquote von über 90 % und senkt die Kosten für Eingabe-Token auf etwa ein Fünftel (gegenüber vergleichbaren Tools etwa ein Drittel der Kosten)
- Ausführung ohne globale Installation mit einer einzigen Zeile:
npx reasonix code(Node ≥ 22, Unterstützung für macOS/Linux/Windows) - Drei zentrale Designprinzipien
- Cache-First Loop: Append-only-Struktur, keine Abhängigkeit von Markern, Erhalt des Prefix-Cache durch deterministische Aufrufreihenfolge
- R1 Thought Harvest: Sammelt die Inferenzkette entgangener Tool-Calls
- Tool-Call Repair: Wiederherstellung per schema-aware Self-Heal-Verfahren
- Terminal-first-Prinzip, daher keine Unterstützung für IDE-Plugins; Terminal-Tools wie
git diffoderlswerden direkt genutzt- Basierend auf TypeScript + Ink TUI, zusätzlich wird ein separater Tauri-Desktop-Client bereitgestellt (mit gebündelter Node-Laufzeit)
- V4-Betrieb mit zwei Ebenen: Standardmäßig V4-Flash für kostengünstige Wiederholungen, Upgrade auf V4-Pro für einen einzelnen Turn via
/pro, Ausführung der gesamten Sitzung mit Pro via/preset max - Erstklassige Unterstützung für MCP (Model Context Protocol): Verbindung externer Server mit einer einzigen Zeile
--mcp "name=cmd args", unterstützt stdio-, SSE- und Streamable-HTTP-Transport - Sandbox +
/plan-Gate: Alle eingebauten Tools sind auf das Ausführungsverzeichnis sandboxed, der/plan-Modus dient als schreibgeschütztes Audit-Gate und blockiert Schreibzugriffe bis zur Freigabe- SEARCH/REPLACE-Bearbeitungen bleiben in einer Pending-Queue und werden erst mit
/applyauf die Festplatte übernommen
- SEARCH/REPLACE-Bearbeitungen bleiben in einer Pending-Queue und werden erst mit
- Composable Skills: Markdown-Dateien unter
.reasonix/skills/<name>.md, isolierte Ausführung über FrontmatterrunAs: subagentundallowed-tools - Replay & Events: Alle Ereignisse werden auf der Festplatte protokolliert, frühere Sitzungen lassen sich mit den Befehlen
reasonix replay / events / statswiedergeben, statistisch auswerten und auditieren - Erweiterbarkeit auf Basis von Plain Text: Alle Einstellungen werden in git-verfolgbaren Klartextdateien in den Verzeichnissen
/mcp,/skills,/memory,/configund/slashverwaltet - Unterstützung für selbst gehostete DeepSeek-Endpunkte: Seit 0.30 sind nicht standardisierte Schlüssel-Präfixe erlaubt; wenn nur
baseUrlauf eine interne Adresse gesetzt wird, funktionieren Schleife, Cache und Tool-Protokoll identisch - DeepSeek-API-Preise: V4-Flash $0.07/Mtok (uncached) · $0.014/Mtok (cached)
- MIT-Lizenz
1 Kommentare
Hacker-News-Kommentare
Ich bin mir nicht sicher, ob man wirklich einen DeepSeek-spezifischen Coding-Agenten braucht, um den DeepSeek-Cache auszunutzen.
Gestern war das Codex-Quota-Problem noch immer nicht gelöst, also habe ich eine winzige Bridge gebaut, um DeepSeek V4 Pro in Codex zu nutzen, und es sah so aus, als wäre fast alles von dem, was ich gemacht habe, gecacht gewesen: https://i.imgur.com/7eKn6wN.png
Stand 2026-05-23 waren es 39.123.200 Token mit Input-Cache-Treffer und 1.692.286 Token ohne Cache-Treffer, und die Bridge macht nichts Besonderes, außer das DeepSeek-API-Format an das anzupassen, was Codex erwartet, also gibt es überhaupt keine Spezialbehandlung rund ums Caching.
Abgesehen davon, dass das Caching besser werden soll, ist mir nicht klar, welchen Vorteil das gegenüber dem direkten Start von OpenCode mit der DeepSeek-API haben soll. Das würde offensichtlich ähnlich cachen, würde direkt mit api.deepseek.com sprechen, falls das wichtig ist, und man bekäme eine deutlich reifere Laufzeitumgebung.
Dort wird erklärt, warum das als bessere Lösung gesehen wird und warum man so eine starke Designphilosophie hat.
„Automatisches Prefix-Caching wird nur aktiviert, wenn der exakte Byte-Prefix der vorherigen Anfrage übereinstimmt. Die meisten Agent-Loops ordnen pro Turn Dinge um, schreiben sie um oder fügen neue Zeitstempel ein — reale Cache-Trefferquoten liegen unter 20 %.“
Deshalb ist es so aufgebaut, dass genau das zusammen mit anderen Techniken optimiert wird, um die Cache-Trefferquote zu erhöhen und die Kosten zu senken.
Für Interessierte: http://github.com/tontinton/maki
DeepSeek v4 ist großartig in Kombination mit claude-code oder opencode. Bei mir war claude code günstiger als opencode, vermutlich wegen der besser entworfenen Laufzeitumgebung.
Am Ende gibt man wohl normale englische Sätze statt Befehlen ein.
Diese Website sieht aus, als wäre sie von Codex gemacht worden. Ich hatte Codex gebeten, für mein Team ein Funktionsüberblicks-HTML zu erstellen, und heraus kam ein überstyliertes Monster mit riesigen Statistikboxen voller fast bedeutungsloser Informationen, dazu genau dieselbe Schrift, Farbe, dasselbe Layout und dieselbe Hero-Section.
Auf Mobilgeräten war es genauso furchtbar wie diese Seite. Am Ende habe ich Claude eine einseitige HTML-Datei erstellen lassen, und mit einer klaren Beschreibung der Absicht waren etwa 95 % direkt brauchbar und mussten nur leicht angepasst werden.
Auf Mobilgeräten schieben die Codebeispiele ständig den Inhalt weg, sodass ein Großteil der Seite kaum lesbar ist. Vielleicht ist das etwas zu hart und die Absicht war gut, aber eine einfachere Website hätte gereicht.
Wie jeder Softwareentwickler weiß, wird praktisch jedes Projekt schlagartig einfacher, wenn man Features weglässt.
Was der Autor verstehen sollte: Manche Leute wollen ein einzelnes, in sich geschlossenes Binary, das nicht die Hälfte des Arbeitsspeichers frisst, und deshalb möchten sie Rust oder Go verwenden.
Der Wert und die Entwicklungsbequemlichkeit, die langsame Interpretersprachen einmal boten, schwinden zunehmend. Die neuen Sprachen bringen die guten Dinge von Haus aus mit, oder genauer gesagt: Die Pager-Alerts um 1 Uhr morgens fangen offenbar an, uns wütend zu machen.
Go hat bereits viele gute Terminal-Bibliotheken.
Mir gefällt die Seite nicht. Wegen der Tipp-Animation ändert sich die Größe des Beispielbereichs ständig, und der darunterliegende Inhalt springt auf und ab.
Das ist wirklich eine schlechte User Experience.
Aber das scheint zunehmend zu einer verlorenen Kunst zu werden.
Aus Sicht von jemandem, der seit einem Jahr an Laufzeitumgebungen arbeitet: Die Leute hinter opencode zerstören den Prefix-Cache nicht, weil sie dumm sind.
In der Regel tun sie das absichtlich, weil Tests zeigen, dass die Gesamtergebnisse so besser sind.
Wenn du glaubst, dass dsv4 sich ausreichend vom Durchschnittsverhalten anderer Modelle unterscheidet, dann schick doch der gewünschten Laufzeitumgebung einen Patch als PR, der mit Belegen eine spezielle Ausnahmebehandlung ergänzt. Blind anzunehmen, man müsse „wegen des Caches immer append-only arbeiten“, verschwendet nur die Zeit aller.
Das ist kein von DeepSeek gebauter Agent, daher ist der Titel irreführend.
Inzwischen ist die Marke DeepSeek stark genug, dass Leute auf diese Markenbekanntheit aufspringen wollen.
Ziemlich interessant. Ich habe ein Claude-Abo für 200 Dollar im Monat und hatte bisher kaum Anlass, etwas anderes zu nutzen.
Aber je stärker Claude meinen Workflow einschränkt, besonders seit den jüngsten Änderungen bei IDE/-p, desto mehr will ich woanders hin.
Ich mache mir zwar Sorgen, weil ich wirklich State-of-the-Art-Reasoning will, aber DeepSeek interessiert mich weiterhin.
Ich habe das getan und festgestellt, dass sogar Qwen-2.5-Max für mich ausreicht. Für die Spielzeugaufgaben, an denen ich arbeite, wäre vermutlich auch Claude Sonnet 3.5 genug. Ich strebe schließlich keine Fields-Medaille in Mathematik an.
Etwa 6 Stunden später hatten beide das vollständige Reverse Engineering nicht geschafft, aber der Unterschied war groß.
DS hielt alle 30 Minuten an und sagte, es habe das vollständige Reverse Engineering abgeschlossen und jetzt würde alles funktionieren, obwohl in Wirklichkeit nicht einmal 1 % erledigt war. Obwohl ich ausdrücklich angewiesen hatte, bestimmte Abkürzungen nicht zu verwenden, suchte es ständig nach solchen Abkürzungen und scheiterte komplett.
GPT-5.5 dagegen war wirklich beeindruckend. Es tat sauber das, was nötig war, und ging nicht zum nächsten Schritt über, bevor es nicht die anfänglichen Ebenen abgeschlossen und sicher verstanden hatte, was erforderlich war. In diesen 6 Stunden habe ich nur dann Prompts eingegeben, wenn ich gesehen habe, dass es in die richtige Richtung geht und ich es mit einer etwas besseren Methode leicht lenken konnte. Es fühlte sich nicht an, als würde ich dagegen ankämpfen.
Natürlich sprang es nach der Verdichtung gelegentlich in ein „Ich kann dir beim Reverse Engineering nicht helfen“, aber in einer neuen Session war das sauber gelöst.
Ich habe mein Claude-Abo vor einem Monat gekündigt und kann deshalb nicht vergleichen, aber DeepSeek erinnerte mich stark daran, wie sich die Arbeit mit Opus 4.6/4.7 anfühlte. Für manche mag das ein positives Signal sein, aber nach GPT-5.5 wird deutlich, wie lästig der Claude-/DS-Stil des Arbeitens ist.
Anthropic braucht dein Geld, um zu überleben, und du schläfst bestimmt besser in dem Gefühl, State of the Art zu nutzen.
Selbst wenn die Tools verschieden sind, funktionieren Markdown-Pläne ziemlich gut. Wenn ich von einem 5x-Max-Abo auf Pro heruntergehe, werde ich das wohl so machen.
Ich baue auch einen Launcher, mit dem sich Drittanbieter in Claude Code leicht verwenden lassen: https://ccode.kronis.dev
Der lokale Proxy funktioniert bereits, es fehlt nur noch dynamisches Modellwechseln. Das dürfte nicht schwer hinzuzufügen sein und sollte je nach Zeitplan in 1–2 Wochen drin sein.
Anthropic komplett zu verlassen, halte ich nicht für klug. Das Modell ist großartig, und mit dem Abo bekommt man auch Dinge wie Remote Control, die ich mag. Ein Tier-Wechsel, um etwas Geld zu sparen, scheint aber möglich. Umgekehrt braucht man eine Qualitäts-Baseline. Als ich früher GLM 4.6 bei Cerebras genutzt habe, waren die Ergebnisse manchmal ziemlich schlampig.
Mir gefällt der Fokus auf Cache-Treffer-Effizienz. Applaus an das DeepSeek-Team dafür, ein großartiges Produkt zu bauen, das die Kosteneffizienz für Nutzer maximiert.
In kostensensiblen Bereichen ist es der Gewinner, und wenn ein Startup das mit Blick auf Data Retention sauber bündelt, könnte das ein hervorragendes Enterprise-Produkt werden. Beim Einsatz als Coding-Assistent sind Datenaufbewahrung und Datenschutz nämlich die entscheidenden Themen.
„Unabhängiges Open-Source-Projekt · Nicht mit DeepSeek verbunden“
Ich verstehe nicht, an welchen Stellschrauben man hier drehen kann.
Ich habe es ausprobiert, und das Texteingabefeld hatte dunkle Schrift auf schwarzem Hintergrund.
Ich habe in der Dokumentation nachgesehen und DeepSeek v4, Claude und Gemini um Hilfe bei Schrift/Stil gebeten, aber nichts funktionierte außer der Ausführung in einem Terminal mit dunklem Theme. Das ist verrückt. Nutzen die Entwickler dieses Projekts alle kein helles Theme?
Helle Themes sind sehr selten.