FLAMEHAVEN FileSearch v1.3.1 – ML-Abhängigkeiten entfernt und Semantic-Search-Engine grundlegend überarbeitet
(github.com/flamehaven01)FLAMEHAVEN FileSearch ist ein Open-Source-Projekt, das mit der Frage begann:
👉 „Lässt sich RAG für die Dokumentensuche leichtgewichtig, reproduzierbar und vollständig self-hosted aufbauen?“
Aktuell steht das Projekt bei ⭐ 81 Stars / 🍴 11 Forks. Es ist zwar noch klein, hat aber mit jedem Release kontinuierlich klare Verbesserungen geliefert.
Das Release v1.3.1 ist nicht einfach nur eine Funktionserweiterung,
👉 sondern ein Update, das mit der Annahme bricht: „Semantic Search = schwergewichtiger ML-Stack“.
🔍 Projekt in einem Satz
-
Self-hosted-RAG-Suchmaschine
-
Dokumente (PDF/DOCX/MD/TXT) hochladen und per Keyword-, semantischer oder hybrider Suche durchsuchen
-
Läuft lokal ohne externe Vector-DB
-
Mit einer einzigen Docker-Zeile in unter 3 Minuten startklar
✨ Zentrale Updates in v1.3.1 (interessant für Entwickler)
1️⃣ ML-Abhängigkeiten vollständig entfernt (größte Änderung)
-
sentence-transformers/torchvollständig entfernt -
Einführung von DSP v2.0 (Deterministic Semantic Projection), einer Eigenimplementierung
-
✔️ Vektorerzeugung < 1 ms
-
✔️ Keine Initialisierungsverzögerung (bisher 2 Minuten → sofort)
-
Semantische Suche, aber deterministisch ohne ML-Frameworks
2️⃣ Speicher- & Performance-Optimierungen
-
int8-Vektorquantisierung
→ 75 % weniger Speicherverbrauch -
Mehr als 30 % schnellere Berechnung der Kosinus-Ähnlichkeit
-
Mehr als 90 % Metadatenkomprimierung (Gravitas-Pack)
-
Lässt sich auch auf privaten Servern oder internen VMs problemlos betreiben
3️⃣ Erweiterte Suchmodi
-
Unterstützung für
keyword-,semantic- undhybrid-Suchmodi -
Einschließlich Tippfehlerkorrektur + Query Refinement
-
Vollständig backward-compatible mit der bestehenden API
4️⃣ Stabilität & Zuverlässigkeit
-
Test-Framework von
pytestaufunittestumgestellt -
19/19 Tests bestanden (0,33 s)
-
Timeouts und CI-Instabilitäten beseitigt
🔐 Weiterhin vorhandene Produktionsfunktionen
-
API-Key-basierte Authentifizierung & Rechteverwaltung
-
Rate Limiting / Audit Log
-
Batch Search (1–100 Queries)
-
Optionaler Redis-Cache
-
Prometheus-Metriken
👀 Besonders geeignet für
-
Teams, die lokales RAG für die interne Dokumentensuche benötigen
-
Umgebungen, in denen sich Daten nur schwer an externe SaaS-Dienste (z. B. Pinecone) übertragen lassen
-
Entwickler in der Phase „PoC steht, aber wie betreiben wir das produktiv?“
-
Engineers, die Reproduzierbarkeit / Kosten / Kontrolle wichtig finden
🔗 GitHub
👉 https://github.com/flamehaven01/Flamehaven-Filesearch
---Wenn Sie es ausprobieren und es hilfreich finden, hilft ein ⭐ sehr weiter.
Meinungen, Feedback und PRs sind alle willkommen.
Noch keine Kommentare.