WaaS – Whisper as a Service

xguru · 2023-02-15T10:47:02+09:00

Open-Source-GUI und -API für OpenAI Whisper (Spracherkennungsmodell), um es lokal einfach nutzen zu können Bietet Funktionen wie transcribe/detect/download als REST API Upload von Audio-/Videodateien über die Webseite möglich, um die Verarbeitung zu starten Ausführung und Nutzung per docker-compose (startet drei Docker-Container wie redis/api/worker) Das kleinste Modell tiny benötigt etwa 1 GB VRAM (das größte, large, 10 GB)

(github.com/schibsted)

11 Punkte von xguru 2023-02-15 | 1 Kommentare | Auf WhatsApp teilen

Open-Source-GUI und -API für OpenAI Whisper (Spracherkennungsmodell), um es lokal einfach nutzen zu können
Bietet Funktionen wie transcribe/detect/download als REST API
Upload von Audio-/Videodateien über die Webseite möglich, um die Verarbeitung zu starten
Ausführung und Nutzung per docker-compose (startet drei Docker-Container wie redis/api/worker)
Das kleinste Modell tiny benötigt etwa 1 GB VRAM (das größte, large, 10 GB)

1 Kommentare

xguru 2023-02-15

Whisper – ein mehrsprachiges Spracherkennungssystem (ASR), das OpenAI als Open Source veröffentlicht hat
OpenAI veröffentlicht das Modell Whisper v2

WaaS – Whisper as a Service

Verwandte Beiträge

1 Kommentare