LLM diskscan: Ein Disk-Scanner, der doppelte Dateien findet und zeigt, welcher Nutzertyp ich bin
(argo9.com)Verlag LLM diskscan: Ein Disk-Scanner, der doppelte Dateien findet und zeigt, welcher Nutzertyp ich bin
Im Verlag ist das Schwierigste im Arbeitsalltag die Organisation von Dateien und Ordnern. Da ein einzelnes Projekt sehr häufig in mehrere Ordner kopiert und parallel weiterbearbeitet wird, entstehen nicht nur auf meinem eigenen System, sondern auch auf den Datenträgern der Mitarbeitenden viele identische Ordner.
Vor einem Jahr habe ich das bereits in Python entwickelt, danach als App mit Go whails umgesetzt, und dieses Mal die Funktionen in Rust weiter ausgebaut und neu erstellt. Außerdem analysiert das Tool Dateiformate und versteckte Dateien und erstellt einen Bericht darüber, welcher Typ von Disk-Nutzer man ist.
Auf Mac, Windows, Linux, NAS und in der Cloud vergleicht es doppelte Dateien und Projekte, prüft, ob es sich um dieselbe Datei handelt oder welche Version neuer ist, und entfernt unnötige Dateien aus Arbeitsdateien wie ._.
Es führt Duplikatsvergleiche und Berichte auf Datenträger-Ebene durch und vergleicht die Originale auf Basis von Hashes.
Es gibt außerdem eine Funktion, die anhand der Dateien auf dem Datenträger eine Art Profil erstellt, sowie einen Bericht darüber ausgibt, an welchen neuen Projekten gearbeitet wird. Es ist ein lokales Programm, und Sie können zwischen lokalen LLMs wie Ollama und LMStudio sowie der Gemini API und der OpenAI API wählen.
Download
Mac
https://drive.google.com/file/d/…
Windows-Installer
1 Kommentare
Der hashbasierte Ansatz zum Bereinigen doppelter Dateien wirkt wie ein robuster Ansatz.
Ich hatte in der Praxis ein ähnliches Problem:
Auch wenn Dateinamen gleich sind, kann der tatsächliche Inhalt unterschiedlich sein,
und dazwischen mischen sich temporäre Arbeitsdateien (
.tmp,._usw.),sodass eine Bereinigung per einfachem Vergleich nicht gut funktioniert.
Der Teil, bei dem per LLM sogar ein Nutzertyp berichtet wird, ist interessant,
aber nach welchen Kriterien wird dieser Report erstellt?
Ich frage mich zum Beispiel, ob er auf der Dateistruktur oder auf der Verteilung der Dateiendungen basiert.