34 Punkte von xguru 2024-04-29 | 1 Kommentare | Auf WhatsApp teilen
  • Mit der Veröffentlichung von v2: bessere Audioqualität, mehrsprachige Unterstützung inklusive Koreanisch und kostenlose kommerzielle Nutzung
  • Klont eine Stimme anhand eines kurzen Audioclips der sprechenden Person und kann Sprache in mehreren Sprachen erzeugen
  • Reproduziert nicht nur die Klangfarbe der Referenzstimme, sondern ermöglicht auch eine feine Steuerung des Sprechstils, etwa Emotion, Intonation, Rhythmus, Pausen und Betonung
  • Ermöglicht Zero-Shot-sprachübergreifendes Stimmenklonen auch für Sprachen, die nicht im Trainingssatz enthalten sind
  • Bietet hervorragende Leistung bei Rechenkosten, die um ein Vielfaches geringer sind als bei kommerziell nutzbaren APIs
  • Änderungen in V2 gegenüber V1, wobei alle Funktionen von V1 enthalten sind (Veröffentlichung: 04/2024)
    • Bessere Audioqualität: V2 verwendet eine andere Trainingsstrategie, die eine bessere Audioqualität liefert
    • Native Mehrsprachenunterstützung: Englisch, Spanisch, Französisch, Chinesisch, Japanisch und Koreanisch werden in OpenVoice V2 nativ unterstützt
    • Kostenlose kommerzielle Nutzung: Seit April 2024 werden sowohl V2 als auch V1 unter der MIT-Lizenz veröffentlicht, wodurch auch die kommerzielle Nutzung kostenlos ist

1 Kommentare

 
xguru 2024-04-29

GN⁺: OpenVoice: vielseitige Technologie zur sofortigen Stimmenklonung
GN⁺: OpenVoice - vielseitige Technologie zur sofortigen Stimmenklonung

Es wurde über GN+ bereits einige Male vorgestellt, und mit der Veröffentlichung von V2 wird nun Mehrsprachigkeit unterstützt, einschließlich Koreanisch.