Open Source zum Echtzeit-Klonen von Stimmen mit nur 5 Sekunden Sprachmaterial einer bestimmten Person

(github.com)

3 Punkte von xguru 2019-11-05 | 2 Kommentare | Auf WhatsApp teilen

Eine Implementierung des Papers „Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis (SV2TTS)“.

2 Kommentare

sduck4 2019-11-05

Wenn sich die Technologien zur Gesichts- und Sprachsynthese weiterentwickeln, wird sich letztlich vielleicht auch die Bedeutung von Aussehen und Stimme verändern. Über äußere, materielle Merkmale wird man eine Person dann nicht mehr eindeutig bestimmen können. Ich glaube, es kommt eine Zeit, in der wir uns stärker auf den menschlichen Geist und das Wesentliche konzentrieren.

xguru 2019-11-05

YouTube-Demovideo: https://www.youtube.com/watch?v=-O_hYhToKoA

Open Source zum Echtzeit-Klonen von Stimmen mit nur 5 Sekunden Sprachmaterial einer bestimmten Person

Verwandte Beiträge

2 Kommentare