- Mit der Veröffentlichung von v2: bessere Audioqualität, mehrsprachige Unterstützung inklusive Koreanisch und kostenlose kommerzielle Nutzung
- Klont eine Stimme anhand eines kurzen Audioclips der sprechenden Person und kann Sprache in mehreren Sprachen erzeugen
- Reproduziert nicht nur die Klangfarbe der Referenzstimme, sondern ermöglicht auch eine feine Steuerung des Sprechstils, etwa Emotion, Intonation, Rhythmus, Pausen und Betonung
- Ermöglicht Zero-Shot-sprachübergreifendes Stimmenklonen auch für Sprachen, die nicht im Trainingssatz enthalten sind
- Bietet hervorragende Leistung bei Rechenkosten, die um ein Vielfaches geringer sind als bei kommerziell nutzbaren APIs
- Änderungen in V2 gegenüber V1, wobei alle Funktionen von V1 enthalten sind (Veröffentlichung: 04/2024)
- Bessere Audioqualität: V2 verwendet eine andere Trainingsstrategie, die eine bessere Audioqualität liefert
- Native Mehrsprachenunterstützung: Englisch, Spanisch, Französisch, Chinesisch, Japanisch und Koreanisch werden in OpenVoice V2 nativ unterstützt
- Kostenlose kommerzielle Nutzung: Seit April 2024 werden sowohl V2 als auch V1 unter der MIT-Lizenz veröffentlicht, wodurch auch die kommerzielle Nutzung kostenlos ist
1 Kommentare
GN⁺: OpenVoice: vielseitige Technologie zur sofortigen Stimmenklonung
GN⁺: OpenVoice - vielseitige Technologie zur sofortigen Stimmenklonung
Es wurde über GN+ bereits einige Male vorgestellt, und mit der Veröffentlichung von V2 wird nun Mehrsprachigkeit unterstützt, einschließlich Koreanisch.