WaaS – Whisper as a Service
(github.com/schibsted)- Open-Source-GUI und -API für OpenAI Whisper (Spracherkennungsmodell), um es lokal einfach nutzen zu können
- Bietet Funktionen wie
transcribe/detect/downloadals REST API - Upload von Audio-/Videodateien über die Webseite möglich, um die Verarbeitung zu starten
- Ausführung und Nutzung per
docker-compose(startet drei Docker-Container wieredis/api/worker) - Das kleinste Modell
tinybenötigt etwa 1 GB VRAM (das größte,large, 10 GB)
1 Kommentare
Whisper – ein mehrsprachiges Spracherkennungssystem (ASR), das OpenAI als Open Source veröffentlicht hat
OpenAI veröffentlicht das Modell Whisper v2