OpenVoice v2 – vielseitige Instant-Stimmenklonung

xguru · 2024-04-29T09:31:01+09:00

Mit der Veröffentlichung von v2: bessere Audioqualität, mehrsprachige Unterstützung inklusive Koreanisch und kostenlose kommerzielle Nutzung Klont eine Stimme anhand eines kurzen Audioclips der sprechenden Person und kann Sprache in mehreren Sprachen erzeugen Reproduziert nicht nur die Klangfarbe der Referenzstimme, sondern ermöglicht auch eine feine Steuerung des Sprechstils, etwa Emotion, Intonation, Rhythmus, Pausen und Betonung Ermöglicht Zero-Shot-sprachübergreifendes Stimmenklonen auch für Sprachen, die nicht im Trainingssatz enthalten sind Bietet hervorragende Leistung bei Rechenkosten, die um ein Vielfaches geringer sind als bei kommerziell nutzbaren APIs Änderungen in V2 gegenüber V1, wobei alle Funktionen von V1 enthalten sind (Veröffentlichung: 04/2024) Bessere Audioqualität: V2 verwendet eine andere Trainingsstrategie, die eine bessere Audioqualität liefert Native Mehrsprachenunterstützung: Englisch, Spanisch, Französisch, Chinesisch, Japanisch und Koreanisch werden in OpenVoice V2 nativ unterstützt Kostenlose kommerzielle Nutzung: Seit April 2024 werden sowohl V2 als auch V1 unter der MIT-Lizenz veröffentlicht, wodurch auch die kommerzielle Nutzung kostenlos ist

(github.com/myshell-ai)

34 Punkte von xguru 2024-04-29 | 1 Kommentare | Auf WhatsApp teilen

Mit der Veröffentlichung von v2: bessere Audioqualität, mehrsprachige Unterstützung inklusive Koreanisch und kostenlose kommerzielle Nutzung
Klont eine Stimme anhand eines kurzen Audioclips der sprechenden Person und kann Sprache in mehreren Sprachen erzeugen
Reproduziert nicht nur die Klangfarbe der Referenzstimme, sondern ermöglicht auch eine feine Steuerung des Sprechstils, etwa Emotion, Intonation, Rhythmus, Pausen und Betonung
Ermöglicht Zero-Shot-sprachübergreifendes Stimmenklonen auch für Sprachen, die nicht im Trainingssatz enthalten sind
Bietet hervorragende Leistung bei Rechenkosten, die um ein Vielfaches geringer sind als bei kommerziell nutzbaren APIs
Änderungen in V2 gegenüber V1, wobei alle Funktionen von V1 enthalten sind (Veröffentlichung: 04/2024)
- Bessere Audioqualität: V2 verwendet eine andere Trainingsstrategie, die eine bessere Audioqualität liefert
- Native Mehrsprachenunterstützung: Englisch, Spanisch, Französisch, Chinesisch, Japanisch und Koreanisch werden in OpenVoice V2 nativ unterstützt
- Kostenlose kommerzielle Nutzung: Seit April 2024 werden sowohl V2 als auch V1 unter der MIT-Lizenz veröffentlicht, wodurch auch die kommerzielle Nutzung kostenlos ist

1 Kommentare

xguru 2024-04-29

GN⁺: OpenVoice: vielseitige Technologie zur sofortigen Stimmenklonung
GN⁺: OpenVoice - vielseitige Technologie zur sofortigen Stimmenklonung

Es wurde über GN+ bereits einige Male vorgestellt, und mit der Veröffentlichung von V2 wird nun Mehrsprachigkeit unterstützt, einschließlich Koreanisch.

OpenVoice v2 – vielseitige Instant-Stimmenklonung

Verwandte Beiträge

1 Kommentare