cgrep: Lokales Code-Intent-Suchtool für AI-Coding-Agenten
(github.com/meghendra6)Hallo. Ich habe ein lokal ausgerichtetes (code-local) Code-Suchtool namens cgrep entwickelt.
Das Kernziel ist, Token-Verschwendung und wiederholte Suchen zu reduzieren, die entstehen, wenn AI-Coding-Agenten eine Codebasis erkunden.
cgrep kombiniert BM25-Suche (Tantivy) + AST-Symbolanalyse (tree-sitter), damit die Erkundung besser zur Code-Intention passt als bei einer einfachen String-Suche.
Hauptfunktionen:
- Code-Erkundung: definition / references / callers / dependents
- Kontext-Erkundung: read / map
- Zweistufiger Agent-Workflow:
agent locate -> agent expand(Kandidaten mit kleinem Payload finden und nur das Nötige erweitern) - MCP-Unterstützung:
cgrep mcp serve+ Unterstützung für Host-Installation - Unterstützung für die Agent-Installation: claude-code, codex, copilot, cursor, opencode
Benchmark auf Basis von PyTorch (6 Szenarien zur Implementierungsverfolgung):
- tokens-to-complete mit grep: 127,665
- tokens-to-complete mit cgrep(agent locate/expand): 6,153
- 95,2 % weniger Tokens (20,75x Reduktion)
- durchschnittliche Suchlatenz bis zum Abschluss: 1321.3ms -> 22.7ms (ca. 58.2x)
Die gesamte Verarbeitung läuft lokal (keine Abhängigkeit von Cloud-Indizes).
Ich freue mich über Feedback:
- Was in realen großen Codebasen noch fehlt
- Welche Verbesserungen für MCP-/Agent-Integration nötig sind
- Ideen zur Erweiterung der Benchmark-Szenarien
Repo: https://github.com/meghendra6/cgrep
Docs: https://meghendra6.github.io/cgrep/
Benchmark: https://meghendra6.github.io/cgrep/benchmarks/…
4 Kommentare
Scheint einen ähnlichen Zweck wie mgrep oder das ck-Tool zu haben.
Wenn ich unter macOS versuche, das Release-Binary auf Basis von v1.4.1 auszuführen, erscheint eine Warnung und es lässt sich nicht starten.
Ich dachte, es wäre auch gut, wenn es wie im agent-browser-Beispiel Skills oder Instructions gäbe, auf die der Agent zurückgreifen kann.
Es gab ein Problem mit der Binärsignatur, das ich behoben habe.
Vielen Dank fürs Prüfen und für die Review!
Der Totten-Reduktionseffekt ist wirklich gut. Wenn im Readme auch Benchmarkergebnisse zum Thema Coding enthalten wären, würde das die Glaubwürdigkeit noch weiter erhöhen, selbst wenn die Benchmark-Performance nur auf einem ähnlichen Niveau gehalten würde.
Wie angeregt, habe ich auch die Benchmark-Ergebnisse für reale Coding-Agent-Szenarien ergänzt.
Vielen Dank für das Feedback!