11 Punkte von xguru 2023-02-15 | 1 Kommentare | Auf WhatsApp teilen
  • Open-Source-GUI und -API für OpenAI Whisper (Spracherkennungsmodell), um es lokal einfach nutzen zu können
  • Bietet Funktionen wie transcribe/detect/download als REST API
  • Upload von Audio-/Videodateien über die Webseite möglich, um die Verarbeitung zu starten
  • Ausführung und Nutzung per docker-compose (startet drei Docker-Container wie redis/api/worker)
  • Das kleinste Modell tiny benötigt etwa 1 GB VRAM (das größte, large, 10 GB)