Voice-Pro – Gradio-WebUI mit Unterstützung für Spracherkennung, Übersetzung und Sprachsynthese

(github.com/abus-aikorea)

9 Punkte von vulcanidic 2024-12-08 | 1 Kommentare | Auf WhatsApp teilen

Voice-Pro ist ein Gradio-WebUI mit Unterstützung für Spracherkennung, Übersetzung und Sprachsynthese.

Hauptfunktionen:

Zero-Shot Voice Cloning. Es wird nur ein 15-sekündiges Sprachsample benötigt. Enthält Stimmen von über 50 Prominenten
YouTube-Audio-Download
Vocal Separation
Mehrsprachige Text-to-Speech-Umwandlung (Edge-TTS, F5-TTS)
Mehrsprachige Übersetzung
Unterstützung für verschiedene Whisper-Engines (Whisper, Faster-Whisper, Whisper-Timestamped)

Video-Demos:

1 Kommentare

yangeok 2024-12-16

Sieht so aus, als hätte das jemand aus Korea gemacht.