9 Punkte von vulcanidic 2024-12-08 | 1 Kommentare | Auf WhatsApp teilen

Voice-Pro ist ein Gradio-WebUI mit Unterstützung für Spracherkennung, Übersetzung und Sprachsynthese.

Hauptfunktionen:

  • Zero-Shot Voice Cloning. Es wird nur ein 15-sekündiges Sprachsample benötigt. Enthält Stimmen von über 50 Prominenten
  • YouTube-Audio-Download
  • Vocal Separation
  • Mehrsprachige Text-to-Speech-Umwandlung (Edge-TTS, F5-TTS)
  • Mehrsprachige Übersetzung
  • Unterstützung für verschiedene Whisper-Engines (Whisper, Faster-Whisper, Whisper-Timestamped)

Video-Demos:

GitHub:
https://github.com/abus-aikorea/voice-pro

1 Kommentare

 
yangeok 2024-12-16

Sieht so aus, als hätte das jemand aus Korea gemacht.