11 Punkte von GN⁺ 2024-12-16 | 3 Kommentare | Auf WhatsApp teilen
  • Buzee ist eine Full-Text-Suchanwendung für Mac und Windows
  • Ein Tool, mit dem Nutzer eine schnelle Full-Text-Suche über alle Dokumente, Bilder, Audiodateien, Videos, Ordner und den Browserverlauf ausführen können
  • Lokale Dokumente und Ordner lassen sich nach Schlüsselwörtern, Zeit, Typ oder einer Kombination daraus durchsuchen
  • Bestimmte Dateien oder Ordner können von der Indexierung ausgeschlossen werden, oder nur deren Inhalte
  • Die App kann per globalem Shortcut ein-/ausgeblendet werden (⎇ / Alt + Space).
  • Innerhalb der App direkt zur Suche springen (⌘ / Ctrl + F or K), zum Scratchpad wechseln (⌘ / Ctrl + Shift + S).
  • Statistiken zu Dateien anzeigen und einzigartige Dokumentprofile bereitstellen
  • Zusatzfunktionen: Textextraktion aus PDFs und Bildern, Nutzung eines Scratchpads, automatische Synchronisierung bei Änderungen im Dateisystem
  • Leichtgewichtiges Installationspaket und geringer Speicherverbrauch
  • Unterstützte Dateiformate
    • Dokumente: csv, docx, key, md, numbers, pages, pdf, pptx, txt, xlsx, xls
    • Bilder: jpg, jpeg, png, gif
    • Bücher: epub, mobi, azw3, pdf
    • Audio: mp3, wav, aac, flac, ogg
    • Video: mp4, mkv, avi, mov, wmv
  • Open Source auf Basis von Rust + NodeJS + Tauri

Semantische Suche

Ein-/Ausschluss in der Suche

  • Dateitypfilter verwenden oder direkt in die Suchanfrage eingeben (z. B. invoice pdf).
  • Für die Suche nach exakten Phrasen Anführungszeichen um Schlüsselwörter setzen (z. B. "annual report").
  • Ein Minuszeichen vor Schlüsselwörtern setzen, die aus der Suche ausgeschlossen werden sollen (z. B. "annual report" -2022 -pdf).

Nach Zeit suchen

  • Einen Datumsbereichsfilter verwenden oder einen Datums-/Zeitbereich direkt in der Suchanfrage angeben.
  • Beispiele: **last month** pdf invoice, annual report ppt **this year**.

Aus dem Source bauen

  • Buzee liefert die beste Leistung auf dem Mac; unter Windows und Linux wurde es nicht ausreichend getestet.
  • Nach der Installation von Rust und NodeJS kann die App im Entwicklungsmodus mit den Befehlen npm install und cargo install ausgeführt werden.

TODO / Bekannte Probleme

  • Verschiedene Funktionen müssen verbessert werden, etwa die Anzeige passender Textstellen in Suchergebnissen oder die Unterstützung komplexer Abfragen bei der Suche im Browserverlauf.
  • Neue Funktionen wie das Hinzufügen von „Tags“ zu Dokumenten, die Erstellung einer „Dashboard“-Ansicht und das Hinzufügen von Tests zur Codebasis sind nötig.

Tech-Stack

  • Backend: Rust, Tauri v2, SQLite, Tantivy.
  • Frontend: Svelte 4, TypeScript, TailwindCSS.

Architektur

  • Sämtliche Dateimetadaten werden in der Tabelle document von SQLite gespeichert.
  • Ein Full-Text-Index wird in der Tabelle metadata erzeugt und in Tantivy gespeichert.
  • Der Verlauf von Firefox, Chrome und Arc wird jeweils über deren Verlaufsdatenbanken durchsucht.

Lizenz

  • MIT-Lizenz.

3 Kommentare

 
dhlee0305 2024-12-16

Bei Version 0.1.1 war ich zunächst etwas zögerlich, aber es funktioniert erst einmal ohne Probleme.
Da ich es allerdings auf einem PC nutze, weiß ich nicht, ob es so eingestellt ist, dass möglichst wenig Ressourcen verbraucht werden, jedenfalls wirkt die Indizierungsgeschwindigkeit eher langsam.
Außerdem ist es praktisch, dass es Text in Dateien einschließlich Bildern findet. Es erinnert ein wenig an Google Desktop.

 
GN⁺ 2024-12-16
Hacker-News-Kommentare
  • Ein Nutzer bittet darum, den Weg zu teilen, warum das Startup gescheitert ist und was man heute beim Neustart anders machen würde. Er wirft die Frage auf, ob das Scheitern vieler Universal-Search-Startups an mangelnder Nachfrage oder an Anpassungsproblemen liegt

  • Jemand bedankt sich dafür, dass es Open Source gemacht wurde, und weist zugleich darauf hin, dass eine AI-Suchfunktion fehlt. Die App habe ein solides Fundament, müsse für die praktische Nutzung aber noch weiter ausgereift werden

  • Es wird erklärt, dass man mit einem Programm namens Recoll verschiedene Dateien durchsuchen kann. Hervorgehoben wird die Möglichkeit, in Thunderbird-Ordnern gespeicherte MS-Word-Dokumente zu durchsuchen und PDF-Dateien per Doppelklick zu öffnen

  • Es wird ein Problem erwähnt, bei dem der Download nicht funktioniert, und gesagt, dass das Tool in Umgebungen nützlich wäre, in denen die Menge elektronischer Aufzeichnungen so groß ist, dass die Windows-Suche nicht mehr funktioniert. Dabei wird die Notwendigkeit einer Verwaltung elektronischer Dateien betont

  • Mit einem Scherz darüber, kein Programm mit dem Namen Labrador Retriever verwenden zu wollen, wird ein Foto des eigenen Hundes geteilt

  • Es wird erwähnt, dass dies ein Versuch gewesen sei, eine Microsoft SharePoint ähnliche Funktion umzusetzen, und darauf hingewiesen, dass es geschäftlich schwierig sei, stark auf MS ausgerichtete Unternehmen zu überzeugen. Zudem wird die Frage gestellt, ob man ein Produkt auf SharePoint aufbauen könnte

  • Es wird darauf hingewiesen, dass der Download-Link nicht funktioniert, und vorgeschlagen, dass ein Projekt, dessen Hauptwert in der GUI liegt, Screenshots enthalten sollte

  • Für komplexe Dateisuchen wird als Option vorgeschlagen, eine Erweiterung von duckdb zu verwenden, mit der sich SQL auf dem Dateisystem ausführen lässt

  • Es wird um Empfehlungen für eine App gebeten, die Google Drive, GitHub, GitLab, Box.com und lokale Dateien durchsuchen kann

  • Jemand bedankt sich dafür, dass es Open Source gemacht wurde, und weist zugleich auf fehlende Dokumentation hin. Die Person baut derzeit ein AI-Dokumentationssystem, fragt um Erlaubnis, Dokumentation zu schreiben und einen PR zu erstellen, und stellt das Projekt AkiraDocs vor