- Eine Vektor-DB, die sich direkt in Anwendungen einbetten lässt und für groß angelegte Ähnlichkeitssuchen mit minimaler Konfiguration entwickelt wurde
- Basiert auf Alibabas Proxima-Engine und bietet produktive Skalierbarkeit und Suchleistung mit geringer Latenz
- Unterstützt sowohl dichte (dense) als auch spärliche (sparse) Vektoren; Multi-Vektor-Abfragen sind mit einem einzigen Aufruf möglich
- Die Hybrid-Suche kombiniert semantische Ähnlichkeit mit strukturellem Filtering und ermöglicht dadurch präzise Suchen
- Als In-Process-Bibliothek läuft sie ohne Server oder Konfigurationsprozess sofort und kann in Notebooks, auf Servern, in der CLI und in Edge-Umgebungen eingesetzt werden
- Unterstützt Linux (x86/ARM) und macOS und lässt sich in Python/Node.js-Umgebungen einfach installieren
- Besteht aus einer C++-basierten Core-Engine sowie SWIG- und Python-Bindings und unterstützt so Hochleistungsberechnungen und die Integration in verschiedene Sprachen
- Verkürzt die Index-Ladezeit und verbessert die Speichereffizienz unter anderem durch
unordered_map-Optimierungen für O(1)-Schlüsselzugriffe im Durchschnitt
- Nutzt Int4/Int8-Quantisierungsoperationen, um bei der Verarbeitung großer Vektormengen das Gleichgewicht zwischen Geschwindigkeit und Genauigkeit zu halten
- Apache-2.0-Lizenz
2 Kommentare
Alibaba hat neulich mit
AliSQLeinen MySQL-Fork vorgestellt und dabei für die Vektorsuche auch DuckDB integriert; sie scheinen gerade wirklich viele neue Dinge auszuprobieren. QWEN ebenso – im KI-Zeitalter wirkt es so, als würde Alibaba unter den chinesischen Unternehmen am engagiertesten Open-Source-Aktivitäten betreiben.Man sieht es wirklich sehr oft.