2 Punkte von flamehaven01 2025-12-19 | Noch keine Kommentare. | Auf WhatsApp teilen

FLAMEHAVEN FileSearch ist ein Open-Source-Projekt, das mit der Frage begann:
👉 „Lässt sich RAG für die Dokumentensuche leichtgewichtig, reproduzierbar und vollständig self-hosted aufbauen?“

Aktuell steht das Projekt bei ⭐ 81 Stars / 🍴 11 Forks. Es ist zwar noch klein, hat aber mit jedem Release kontinuierlich klare Verbesserungen geliefert.

Das Release v1.3.1 ist nicht einfach nur eine Funktionserweiterung,
👉 sondern ein Update, das mit der Annahme bricht: „Semantic Search = schwergewichtiger ML-Stack“.


🔍 Projekt in einem Satz

  • Self-hosted-RAG-Suchmaschine

  • Dokumente (PDF/DOCX/MD/TXT) hochladen und per Keyword-, semantischer oder hybrider Suche durchsuchen

  • Läuft lokal ohne externe Vector-DB

  • Mit einer einzigen Docker-Zeile in unter 3 Minuten startklar


✨ Zentrale Updates in v1.3.1 (interessant für Entwickler)
1️⃣ ML-Abhängigkeiten vollständig entfernt (größte Änderung)

  • sentence-transformers / torch vollständig entfernt

  • Einführung von DSP v2.0 (Deterministic Semantic Projection), einer Eigenimplementierung

  • ✔️ Vektorerzeugung < 1 ms

  • ✔️ Keine Initialisierungsverzögerung (bisher 2 Minuten → sofort)

  • Semantische Suche, aber deterministisch ohne ML-Frameworks


2️⃣ Speicher- & Performance-Optimierungen

  • int8-Vektorquantisierung
    → 75 % weniger Speicherverbrauch

  • Mehr als 30 % schnellere Berechnung der Kosinus-Ähnlichkeit

  • Mehr als 90 % Metadatenkomprimierung (Gravitas-Pack)

  • Lässt sich auch auf privaten Servern oder internen VMs problemlos betreiben


3️⃣ Erweiterte Suchmodi

  • Unterstützung für keyword-, semantic- und hybrid-Suchmodi

  • Einschließlich Tippfehlerkorrektur + Query Refinement

  • Vollständig backward-compatible mit der bestehenden API


4️⃣ Stabilität & Zuverlässigkeit

  • Test-Framework von pytest auf unittest umgestellt

  • 19/19 Tests bestanden (0,33 s)

  • Timeouts und CI-Instabilitäten beseitigt


🔐 Weiterhin vorhandene Produktionsfunktionen

  • API-Key-basierte Authentifizierung & Rechteverwaltung

  • Rate Limiting / Audit Log

  • Batch Search (1–100 Queries)

  • Optionaler Redis-Cache

  • Prometheus-Metriken


👀 Besonders geeignet für

  • Teams, die lokales RAG für die interne Dokumentensuche benötigen

  • Umgebungen, in denen sich Daten nur schwer an externe SaaS-Dienste (z. B. Pinecone) übertragen lassen

  • Entwickler in der Phase „PoC steht, aber wie betreiben wir das produktiv?“

  • Engineers, die Reproduzierbarkeit / Kosten / Kontrolle wichtig finden


🔗 GitHub

👉 https://github.com/flamehaven01/Flamehaven-Filesearch

---Wenn Sie es ausprobieren und es hilfreich finden, hilft ein ⭐ sehr weiter.
Meinungen, Feedback und PRs sind alle willkommen.

Noch keine Kommentare.

Noch keine Kommentare.