- Artikel über eine neue browserbasierte Wikipedia-Suchmaschine, die Offline-Suche ermöglicht
- Suchmaschine mit Echtzeitsuche durch eine Million Wikipedia-Seiten, liefert auf Mobilgeräten alle 10 ms Ergebnisse zurück
- Kleine Größe der Suchmaschinen-Datenbank, unterstützt eine Million Embeddings für einfache Anwendungsfälle ohne besondere Verarbeitung
- Suchmaschine mit Dokument-Embeddings per Sentence Transformer, Embedding-Komprimierung mittels Product Quantization und
pq.js für Distanzberechnungen im Browser
- Verwendet
transformers.js, um einen Sentence Transformer im Browser für Suchanfragen auszuführen
- Die Suchmaschine sortiert Embeddings nach der komprimierten Seitengröße, sodass Seiten mit hoher Informationsdichte zuerst analysiert und in den Top 10 zurückgegeben werden
- Für hohe Performance verwendet die Suchmaschine Arrow statt JSON; Arrow kann 8-Bit-Integer-Arrays der Product Quantization kompakt speichern
- Die Suchmaschine verwendet ONNX-Modelle, die in WebAssembly laufen; GPU-Beschleunigung gibt es noch nicht
- Suchmaschine, die die gesamte Wikipedia mit einem Sentence Transformer einbettet, Embeddings per Product Quantization komprimiert und ONNX manuell schreibt
- Die Suchmaschine exportiert NumPy nach Arrow, um Embeddings und Metadaten zu speichern; deutlich kompakter im Speicher und auf der Festplatte
- Die Suchmaschine unterstützt Facettensuche, die Echtzeitsuche in Produktunterkategorien erlaubt
- Der Autor lädt zu Feedback und Verbesserungsvorschlägen ein, insbesondere zur Unterstützung anderer Quantisierungsstufen und anderer Embedding-Dimensionen
1 Kommentare
Hacker-News-Kommentare