- Eine kostenlose Open-Source-Sprache-zu-Text-App, die vollständig offline funktioniert, als Tauri-Desktop-App auf Basis von Rust + React/TypeScript
- Per Tastenkürzel Aufnahme starten → sprechen → lokale Umwandlung ohne Cloud-Übertragung → automatische Texteingabe
- Arbeitet mit den Modellen Whisper und Parakeet V3 mit GPU-Beschleunigung oder CPU-optimierter Ausführung und unterstützt Windows, macOS, Linux
- Ziel des Projekts ist nicht die „perfekteste Spracherkennungs-App“, sondern die am einfachsten zu forkende App zu bauen, die sich von allen leicht anpassen und erweitern lässt und Open Source, kostenlos und offline ist
- Tech-Stack
- Frontend: React + TypeScript + Tailwind CSS
- Backend: Rust-basiert, zuständig für Audioverarbeitung und Machine-Learning-Inferenz
- Kernbibliotheken:
whisper-rs (Whisper-basierte Spracherkennung)
transcription-rs (CPU-optimiertes Parakeet-Modell)
cpal (plattformübergreifendes Audio-I/O)
vad-rs (Sprachaktivitätserkennung)
rdev (globale Tastenkürzel und Ereignisverarbeitung)
rubato (Audio-Resampling)
- Offizielle Website: https://handy.computer/
1 Kommentare
Großartig.