Voice-Pro – Gradio-WebUI mit Unterstützung für Spracherkennung, Übersetzung und Sprachsynthese
(github.com/abus-aikorea)Voice-Pro ist ein Gradio-WebUI mit Unterstützung für Spracherkennung, Übersetzung und Sprachsynthese.
Hauptfunktionen:
- Zero-Shot Voice Cloning. Es wird nur ein 15-sekündiges Sprachsample benötigt. Enthält Stimmen von über 50 Prominenten
- YouTube-Audio-Download
- Vocal Separation
- Mehrsprachige Text-to-Speech-Umwandlung (Edge-TTS, F5-TTS)
- Mehrsprachige Übersetzung
- Unterstützung für verschiedene Whisper-Engines (Whisper, Faster-Whisper, Whisper-Timestamped)
Video-Demos:
-
Tutorial zur Nutzung von Voice-Pro: https://youtu.be/z8g8LMhoh_o
-
Demo zur Podcast-Erstellung mit Voice Cloning: https://youtu.be/Wfo7vQCD4no
-
Demos und Beispielvideos: https://youtube.com/playlist/?list=PLwx5dnMDVC9Y7dAjm9r26CZUw1uU5VIeq
1 Kommentare
Sieht so aus, als hätte das jemand aus Korea gemacht.