1 Kommentare

 
GN⁺ 2024-12-26
Hacker-News-Kommentare
  • Es gibt eine Frage dazu, warum das Modell von mixbread verwendet wird.
  • Es gibt eine Frage dazu, ob sich die Effizienz verbessert, wenn Embeddings binarisiert und Hamming-Distanzen verwendet werden.
  • Es gibt eine Frage dazu, warum milvus statt anderer Vektor-Storage-Lösungen gewählt wurde.
  • Es gibt eine Frage dazu, ob die wöchentlichen Metadaten automatisiert sind.
  • Das Nutzerfeedback zur Suche nach "Transformers auf Byte-Ebene" war gut, aber aktuelle Papers wurden nicht gefunden.
    • Wenn mehr Ergebnisdichte gewünscht ist, könnte man als UI-Option erwägen, die Abstracts einzuklappen, damit auf den ersten Blick mehr angezeigt wird.
  • Wenn eine Erweiterung über arXiv hinaus in Betracht gezogen wird, könnten große Verlage OpenAlex usw. dazu zwingen, Abstracts zu entfernen, was Literaturrecherchen erschweren könnte.
  • Es gibt eine Frage dazu, ob andere Tools wie undermind.ai, scite.ai und elicit.org geprüft wurden.
  • Es muss überlegt werden, was außer der Suche noch zu einem dedizierten Produkt-Workflow für Literaturrecherche gehören könnte.
  • Früher war in Vektordatenbanken wie gensim/doc2vec Echtzeit-CPU-Brute-Force möglich.
  • Es gibt Ideen für andere gute Bereiche, in denen semantische Suche nützlich sein könnte.
    • Suche in Online-Werbung: Video- und Bildanzeigen können eingebettet und indexiert werden, um Marketing-Inspiration zu finden.
    • Suche über mehrere E-Commerce-Plattformen hinweg: Produkte könnten auf Sephora, zara, h&m usw. gefunden werden.
  • Es gibt die Meinung, dass ein Link zu "ähnlichen Papers" bei jedem Paper nützlich wäre, um Themen zu entdecken.
  • Es gibt eine Frage dazu, welche Vorteile semantische Suche gegenüber Textsuche hat.
    • Es gibt eine Frage dazu, ob es Benchmarks gibt, mit denen sich Verbesserungen der Suche überprüfen lassen.
  • Es gibt eine Frage dazu, ob es dem Semantic Scholar des Allen Institute for AI ähnelt.
  • Es gibt den Vorschlag, dem Backend von paper-qa einen Search-Tool-Client hinzuzufügen.
  • Es gibt die Meinung, dass man scihib crawlen und verknüpfen möchte.
  • Es gibt einen Hinweis auf ein Encoding-Problem.
    • Bei der Suche nach "UPC Hochleistungsrechnen Bewertung" werden Papers mit fehlerhaften Autorennamen gefunden.