1 Punkte von mansuiki 4 시간 전 | Noch keine Kommentare. | Auf WhatsApp teilen

Hallo. Ich habe turbo-graph entwickelt, das auf turbovec/TurboQuant basiert und eine Graph-Memory-Layer für constrained RAG ergänzt.

turbovec ist bereits gut, wenn es um flat top-k oder eine günstige Allowlist geht. In echtem RAG sehen Queries aber oft so aus.

tenant ACL ∩ tag ∩ source ∩ time window ∩ graph neighbors ∩ BM25 candidates

Diese Kombination wird dann jedes Mal in der Python-/SQL-/App-Layer gebaut, wieder an die Vector Search übergeben, die Ergebnisse werden erneut mit Graph/BM25 gererankt, und es wird Code wiederholt, um zu erklären, warum genau diese Resultate herausgekommen sind.

turbo-graph ist ein Experiment, das den turbovec-kompatiblen Core beibehält und die darum liegende Graph-/Metadata-View-Kompilierung, Cache-Reuse, Graph-Reranking und Explain-Telemetrie in die Index-Layer verlagert.

Da es noch Alpha ist, ist es weniger mit dem Ziel gedacht, es sofort in Production einzusetzen, sondern eher, Feedback dazu zu bekommen, welche API in echten RAG-Routen benötigt wird.

GitHub:
https://github.com/bigmacfive/turbo-graph

Noch keine Kommentare.

Noch keine Kommentare.