7 Punkte von meghendra 2026-02-14 | 4 Kommentare | Auf WhatsApp teilen

Hallo. Ich habe ein lokal ausgerichtetes (code-local) Code-Suchtool namens cgrep entwickelt.

Das Kernziel ist, Token-Verschwendung und wiederholte Suchen zu reduzieren, die entstehen, wenn AI-Coding-Agenten eine Codebasis erkunden.
cgrep kombiniert BM25-Suche (Tantivy) + AST-Symbolanalyse (tree-sitter), damit die Erkundung besser zur Code-Intention passt als bei einer einfachen String-Suche.

Hauptfunktionen:

  • Code-Erkundung: definition / references / callers / dependents
  • Kontext-Erkundung: read / map
  • Zweistufiger Agent-Workflow: agent locate -> agent expand (Kandidaten mit kleinem Payload finden und nur das Nötige erweitern)
  • MCP-Unterstützung: cgrep mcp serve + Unterstützung für Host-Installation
  • Unterstützung für die Agent-Installation: claude-code, codex, copilot, cursor, opencode

Benchmark auf Basis von PyTorch (6 Szenarien zur Implementierungsverfolgung):

  • tokens-to-complete mit grep: 127,665
  • tokens-to-complete mit cgrep(agent locate/expand): 6,153
  • 95,2 % weniger Tokens (20,75x Reduktion)
  • durchschnittliche Suchlatenz bis zum Abschluss: 1321.3ms -> 22.7ms (ca. 58.2x)

Die gesamte Verarbeitung läuft lokal (keine Abhängigkeit von Cloud-Indizes).

Ich freue mich über Feedback:

  • Was in realen großen Codebasen noch fehlt
  • Welche Verbesserungen für MCP-/Agent-Integration nötig sind
  • Ideen zur Erweiterung der Benchmark-Szenarien

Repo: https://github.com/meghendra6/cgrep
Docs: https://meghendra6.github.io/cgrep/
Benchmark: https://meghendra6.github.io/cgrep/benchmarks/…

4 Kommentare

 
winterjung 2026-02-15

Scheint einen ähnlichen Zweck wie mgrep oder das ck-Tool zu haben.
Wenn ich unter macOS versuche, das Release-Binary auf Basis von v1.4.1 auszuführen, erscheint eine Warnung und es lässt sich nicht starten.
Ich dachte, es wäre auch gut, wenn es wie im agent-browser-Beispiel Skills oder Instructions gäbe, auf die der Agent zurückgreifen kann.

 
meghendra 2026-02-16

Es gab ein Problem mit der Binärsignatur, das ich behoben habe.
Vielen Dank fürs Prüfen und für die Review!

 
woung717 2026-02-15

Der Totten-Reduktionseffekt ist wirklich gut. Wenn im Readme auch Benchmarkergebnisse zum Thema Coding enthalten wären, würde das die Glaubwürdigkeit noch weiter erhöhen, selbst wenn die Benchmark-Performance nur auf einem ähnlichen Niveau gehalten würde.

 
meghendra 2026-02-17

Wie angeregt, habe ich auch die Benchmark-Ergebnisse für reale Coding-Agent-Szenarien ergänzt.
Vielen Dank für das Feedback!