DeepSeek Reasonix – DeepSeek-nativer Coding-Agent mit hoher Cache-Nutzung und niedrigen Kosten

(esengine.github.io)

3 Punkte von GN⁺ 2026-05-25 | 2 Kommentare | Auf WhatsApp teilen

Open-Source-Terminal-Coding-Agent, der ausschließlich für die DeepSeek API entwickelt wurde und direkt mit api.deepseek.com kommuniziert
Die Append-only-Schleife ist für den byte-stabilen Prefix-Cache von DeepSeek optimiert, hält in langen Sitzungen eine Cache-Trefferquote von über 90 % und senkt die Kosten für Eingabe-Token auf etwa ein Fünftel (gegenüber vergleichbaren Tools etwa ein Drittel der Kosten)
Ausführung ohne globale Installation mit einer einzigen Zeile: npx reasonix code (Node ≥ 22, Unterstützung für macOS/Linux/Windows)
Drei zentrale Designprinzipien
- Cache-First Loop: Append-only-Struktur, keine Abhängigkeit von Markern, Erhalt des Prefix-Cache durch deterministische Aufrufreihenfolge
- R1 Thought Harvest: Sammelt die Inferenzkette entgangener Tool-Calls
- Tool-Call Repair: Wiederherstellung per schema-aware Self-Heal-Verfahren
Terminal-first-Prinzip, daher keine Unterstützung für IDE-Plugins; Terminal-Tools wie git diff oder ls werden direkt genutzt
- Basierend auf TypeScript + Ink TUI, zusätzlich wird ein separater Tauri-Desktop-Client bereitgestellt (mit gebündelter Node-Laufzeit)
V4-Betrieb mit zwei Ebenen: Standardmäßig V4-Flash für kostengünstige Wiederholungen, Upgrade auf V4-Pro für einen einzelnen Turn via /pro, Ausführung der gesamten Sitzung mit Pro via /preset max
Erstklassige Unterstützung für MCP (Model Context Protocol): Verbindung externer Server mit einer einzigen Zeile --mcp "name=cmd args", unterstützt stdio-, SSE- und Streamable-HTTP-Transport
Sandbox + /plan-Gate: Alle eingebauten Tools sind auf das Ausführungsverzeichnis sandboxed, der /plan-Modus dient als schreibgeschütztes Audit-Gate und blockiert Schreibzugriffe bis zur Freigabe
- SEARCH/REPLACE-Bearbeitungen bleiben in einer Pending-Queue und werden erst mit /apply auf die Festplatte übernommen
Composable Skills: Markdown-Dateien unter .reasonix/skills/<name>.md, isolierte Ausführung über Frontmatter runAs: subagent und allowed-tools
Replay & Events: Alle Ereignisse werden auf der Festplatte protokolliert, frühere Sitzungen lassen sich mit den Befehlen reasonix replay / events / stats wiedergeben, statistisch auswerten und auditieren
Erweiterbarkeit auf Basis von Plain Text: Alle Einstellungen werden in git-verfolgbaren Klartextdateien in den Verzeichnissen /mcp, /skills, /memory, /config und /slash verwaltet
Unterstützung für selbst gehostete DeepSeek-Endpunkte: Seit 0.30 sind nicht standardisierte Schlüssel-Präfixe erlaubt; wenn nur baseUrl auf eine interne Adresse gesetzt wird, funktionieren Schleife, Cache und Tool-Protokoll identisch
DeepSeek-API-Preise: V4-Flash $0.07/Mtok (uncached) · $0.014/Mtok (cached)
MIT-Lizenz

2 Kommentare

myoun 2026-05-25

Wenn man darüber nachdenkt, scheint es keine schlechte Idee zu sein, DeepSeek als Coding-Agent zu verwenden.

GN⁺ 2026-05-25

Hacker-News-Kommentare

Ich bin mir nicht sicher, ob man wirklich einen DeepSeek-spezifischen Coding-Agenten braucht, um den DeepSeek-Cache auszunutzen.
Gestern war das Codex-Quota-Problem noch immer nicht gelöst, also habe ich eine winzige Bridge gebaut, um DeepSeek V4 Pro in Codex zu nutzen, und es sah so aus, als wäre fast alles von dem, was ich gemacht habe, gecacht gewesen: https://i.imgur.com/7eKn6wN.png
Stand 2026-05-23 waren es 39.123.200 Token mit Input-Cache-Treffer und 1.692.286 Token ohne Cache-Treffer, und die Bridge macht nichts Besonderes, außer das DeepSeek-API-Format an das anzupassen, was Codex erwartet, also gibt es überhaupt keine Spezialbehandlung rund ums Caching.
Abgesehen davon, dass das Caching besser werden soll, ist mir nicht klar, welchen Vorteil das gegenüber dem direkten Start von OpenCode mit der DeepSeek-API haben soll. Das würde offensichtlich ähnlich cachen, würde direkt mit api.deepseek.com sprechen, falls das wichtig ist, und man bekäme eine deutlich reifere Laufzeitumgebung.
- Es scheint besser zu sein, auf diese Seite zu verlinken: https://github.com/esengine/DeepSeek-Reasonix/blob/main/docs...
  Dort wird erklärt, warum das als bessere Lösung gesehen wird und warum man so eine starke Designphilosophie hat.
  „Automatisches Prefix-Caching wird nur aktiviert, wenn der exakte Byte-Prefix der vorherigen Anfrage übereinstimmt. Die meisten Agent-Loops ordnen pro Turn Dinge um, schreiben sie um oder fügen neue Zeitstempel ein — reale Cache-Trefferquoten liegen unter 20 %.“
  Deshalb ist es so aufgebaut, dass genau das zusammen mit anderen Techniken optimiert wird, um die Cache-Trefferquote zu erhöhen und die Kosten zu senken.
- OpenCode hat ziemlich ernste Probleme mit der Cache-Stabilität, und im Moment scheint man wenig Motivation zu haben, das zu beheben.
- Das war auch genau mein Gedanke, und als ich mir den DeepSeek-Provider-Code meines Coding-Agenten angesehen habe, war fast alles, was der Autor beschreibt, bereits umgesetzt.
  Für Interessierte: http://github.com/tontinton/maki
- Wenn du „eine kleine Bridge gebaut hast, um DeepSeek V4 Pro in Codex zu nutzen“, würde mich interessieren, ob du diese Bridge teilen könntest.
  DeepSeek v4 ist großartig in Kombination mit claude-code oder opencode. Bei mir war claude code günstiger als opencode, vermutlich wegen der besser entworfenen Laufzeitumgebung.
- Das scheint nativ am Terminal zu hängen. Also offenbar eine Struktur ohne separate App, die den Agenten in einer TUI ausführt oder umhüllt.
  Am Ende gibt man wohl normale englische Sätze statt Befehlen ein.
Diese Website sieht aus, als wäre sie von Codex gemacht worden. Ich hatte Codex gebeten, für mein Team ein Funktionsüberblicks-HTML zu erstellen, und heraus kam ein überstyliertes Monster mit riesigen Statistikboxen voller fast bedeutungsloser Informationen, dazu genau dieselbe Schrift, Farbe, dasselbe Layout und dieselbe Hero-Section.
Auf Mobilgeräten war es genauso furchtbar wie diese Seite. Am Ende habe ich Claude eine einseitige HTML-Datei erstellen lassen, und mit einer klaren Beschreibung der Absicht waren etwa 95 % direkt brauchbar und mussten nur leicht angepasst werden.
- Viel LLM-basiertes Design sieht heutzutage so aus. Ich verstehe nicht, warum Leute diese Kombinationen aus stark geneigten Serifenschriften nicht hässlich finden.
  Auf Mobilgeräten schieben die Codebeispiele ständig den Inhalt weg, sodass ein Großteil der Seite kaum lesbar ist. Vielleicht ist das etwas zu hart und die Absicht war gut, aber eine einfachere Website hätte gereicht.
- Die Aussage „Claude hat eine einseitige HTML-Datei erzeugt und 95 % waren direkt nutzbar“ sagt für sich genommen nicht viel über irgendein Modell aus.
  Wie jeder Softwareentwickler weiß, wird praktisch jedes Projekt schlagartig einfacher, wenn man Features weglässt.
Was der Autor verstehen sollte: Manche Leute wollen ein einzelnes, in sich geschlossenes Binary, das nicht die Hälfte des Arbeitsspeichers frisst, und deshalb möchten sie Rust oder Go verwenden.
- Ich freue mich wirklich darüber, dass so viel neue Software in Rust, Go und Zig erscheint.
  Der Wert und die Entwicklungsbequemlichkeit, die langsame Interpretersprachen einmal boten, schwinden zunehmend. Die neuen Sprachen bringen die guten Dinge von Haus aus mit, oder genauer gesagt: Die Pager-Alerts um 1 Uhr morgens fangen offenbar an, uns wütend zu machen.
- Trotz des AI-Aspekts und all der Behauptungen würde mich interessieren, ob jemand erklären kann, warum man zum Beispiel keinen Coding-Agenten in reinem Go verwenden sollte.
  Go hat bereits viele gute Terminal-Bibliotheken.
- Wenn du ein einzelnes, in sich geschlossenes Binary ausprobieren willst, das mehr als die Hälfte des Arbeitsspeichers verbraucht, gibt es auch ds4-agent.
- Gerade im Zeitalter von Coding-Agenten fragt man sich da doch: Warum nicht einfach selbst bauen?
- Dass man beim Bauen eines Coding-Bots ausgerechnet am Coden spart, sagt irgendwie schon etwas aus.
Mir gefällt die Seite nicht. Wegen der Tipp-Animation ändert sich die Größe des Beispielbereichs ständig, und der darunterliegende Inhalt springt auf und ab.
Das ist wirklich eine schlechte User Experience.
- Ob mit oder ohne Agenten: Leute sollten Websites weiterhin in mehreren Auflösungen oder wenigstens bei verschiedenen Fensterbreiten testen.
  Aber das scheint zunehmend zu einer verlorenen Kunst zu werden.
- Sieht aus wie von Claude erzeugter Design-AI-Müll.
Aus Sicht von jemandem, der seit einem Jahr an Laufzeitumgebungen arbeitet: Die Leute hinter opencode zerstören den Prefix-Cache nicht, weil sie dumm sind.
In der Regel tun sie das absichtlich, weil Tests zeigen, dass die Gesamtergebnisse so besser sind.
Wenn du glaubst, dass dsv4 sich ausreichend vom Durchschnittsverhalten anderer Modelle unterscheidet, dann schick doch der gewünschten Laufzeitumgebung einen Patch als PR, der mit Belegen eine spezielle Ausnahmebehandlung ergänzt. Blind anzunehmen, man müsse „wegen des Caches immer append-only arbeiten“, verschwendet nur die Zeit aller.
Das ist kein von DeepSeek gebauter Agent, daher ist der Titel irreführend.
Inzwischen ist die Marke DeepSeek stark genug, dass Leute auf diese Markenbekanntheit aufspringen wollen.
Ziemlich interessant. Ich habe ein Claude-Abo für 200 Dollar im Monat und hatte bisher kaum Anlass, etwas anderes zu nutzen.
Aber je stärker Claude meinen Workflow einschränkt, besonders seit den jüngsten Änderungen bei IDE/-p, desto mehr will ich woanders hin.
Ich mache mir zwar Sorgen, weil ich wirklich State-of-the-Art-Reasoning will, aber DeepSeek interessiert mich weiterhin.
- Wenn du State-of-the-Art-Reasoning willst, probier ruhig auch andere Modelle aus und schau selbst, wie groß der Unterschied zu den Top-Modellen wirklich ist.
  Ich habe das getan und festgestellt, dass sogar Qwen-2.5-Max für mich ausreicht. Für die Spielzeugaufgaben, an denen ich arbeite, wäre vermutlich auch Claude Sonnet 3.5 genug. Ich strebe schließlich keine Fields-Medaille in Mathematik an.
- Ich habe heute eine ziemlich komplexe Reverse-Engineering-Aufgabe an DS-4 xhigh und GPT-5.5 xhigh gegeben.
  Etwa 6 Stunden später hatten beide das vollständige Reverse Engineering nicht geschafft, aber der Unterschied war groß.
  DS hielt alle 30 Minuten an und sagte, es habe das vollständige Reverse Engineering abgeschlossen und jetzt würde alles funktionieren, obwohl in Wirklichkeit nicht einmal 1 % erledigt war. Obwohl ich ausdrücklich angewiesen hatte, bestimmte Abkürzungen nicht zu verwenden, suchte es ständig nach solchen Abkürzungen und scheiterte komplett.
  GPT-5.5 dagegen war wirklich beeindruckend. Es tat sauber das, was nötig war, und ging nicht zum nächsten Schritt über, bevor es nicht die anfänglichen Ebenen abgeschlossen und sicher verstanden hatte, was erforderlich war. In diesen 6 Stunden habe ich nur dann Prompts eingegeben, wenn ich gesehen habe, dass es in die richtige Richtung geht und ich es mit einer etwas besseren Methode leicht lenken konnte. Es fühlte sich nicht an, als würde ich dagegen ankämpfen.
  Natürlich sprang es nach der Verdichtung gelegentlich in ein „Ich kann dir beim Reverse Engineering nicht helfen“, aber in einer neuen Session war das sauber gelöst.
  Ich habe mein Claude-Abo vor einem Monat gekündigt und kann deshalb nicht vergleichen, aber DeepSeek erinnerte mich stark daran, wie sich die Arbeit mit Opus 4.6/4.7 anfühlte. Für manche mag das ein positives Signal sein, aber nach GPT-5.5 wird deutlich, wie lästig der Claude-/DS-Stil des Arbeitens ist.
- Behalte auf jeden Fall den 200-Dollar-Plan und probiere bloß nicht den 10-Dollar-Coding-Plan mit Open-Weight-Modellen und höheren Limits aus.
  Anthropic braucht dein Geld, um zu überleben, und du schläfst bestimmt besser in dem Gefühl, State of the Art zu nutzen.
- Anstatt Anthropic-Modelle komplett aufzugeben, könntest du sie für bestimmte Aufgaben wie Planung nutzen und die Implementierung dann an etwas wie DeepSeek delegieren.
  Selbst wenn die Tools verschieden sind, funktionieren Markdown-Pläne ziemlich gut. Wenn ich von einem 5x-Max-Abo auf Pro heruntergehe, werde ich das wohl so machen.
  Ich baue auch einen Launcher, mit dem sich Drittanbieter in Claude Code leicht verwenden lassen: https://ccode.kronis.dev
  Der lokale Proxy funktioniert bereits, es fehlt nur noch dynamisches Modellwechseln. Das dürfte nicht schwer hinzuzufügen sein und sollte je nach Zeitplan in 1–2 Wochen drin sein.
  Anthropic komplett zu verlassen, halte ich nicht für klug. Das Modell ist großartig, und mit dem Abo bekommt man auch Dinge wie Remote Control, die ich mag. Ein Tier-Wechsel, um etwas Geld zu sparen, scheint aber möglich. Umgekehrt braucht man eine Qualitäts-Baseline. Als ich früher GLM 4.6 bei Cerebras genutzt habe, waren die Ergebnisse manchmal ziemlich schlampig.
- Wenn du State-of-the-Art-Reasoning willst, musst du GPT 5.5 Pro verwenden.
Mir gefällt der Fokus auf Cache-Treffer-Effizienz. Applaus an das DeepSeek-Team dafür, ein großartiges Produkt zu bauen, das die Kosteneffizienz für Nutzer maximiert.
- Ich habe es eine Weile benutzt und stimme voll zu. Meiner Meinung nach ist es so gut wie Codex oder Claude, die ich sonst nutze.
  In kostensensiblen Bereichen ist es der Gewinner, und wenn ein Startup das mit Blick auf Data Retention sauber bündelt, könnte das ein hervorragendes Enterprise-Produkt werden. Beim Einsatz als Coding-Assistent sind Datenaufbewahrung und Datenschutz nämlich die entscheidenden Themen.
- Nur damit es kein Missverständnis gibt: Dieses Projekt ist ein Side-Project von jemandem.
  „Unabhängiges Open-Source-Projekt · Nicht mit DeepSeek verbunden“
- Zusammen mit den ohnehin günstigen API-Kosten könnte man damit wahrscheinlich tagelang dieselbe Aufgabe laufen lassen.
- Ich verstehe nicht, wie diese Cache-Treffer-Effizienz möglich sein soll. Geht es nicht einfach darum, den vorherigen Kontext nicht zu verändern?
  Ich verstehe nicht, an welchen Stellschrauben man hier drehen kann.
Ich habe es ausprobiert, und das Texteingabefeld hatte dunkle Schrift auf schwarzem Hintergrund.
Ich habe in der Dokumentation nachgesehen und DeepSeek v4, Claude und Gemini um Hilfe bei Schrift/Stil gebeten, aber nichts funktionierte außer der Ausführung in einem Terminal mit dunklem Theme. Das ist verrückt. Nutzen die Entwickler dieses Projekts alle kein helles Theme?
- Ich stimme zu, dass das ein Problem ist, aber wahrscheinlich wird es in der Praxis einfach nicht verwendet.
  Helle Themes sind sehr selten.

DeepSeek Reasonix – DeepSeek-nativer Coding-Agent mit hoher Cache-Nutzung und niedrigen Kosten

Verwandte Beiträge

2 Kommentare

Hacker-News-Kommentare