- Unterstützt 31 Sprachen inklusive Koreanisch
- Neue Unterstützung für Emotions-Tags: 10 Tags wie
<laugh>, <breath>, <scream> können in den Text eingefügt werden, um Emotionen auszudrücken
- Qualitätsverbesserungen: höhere Aussprachegenauigkeit, weniger Fehler durch Wortwiederholungen/-auslassungen, verbesserte Voice-Cloning-Leistung
- Modellgröße: 99M Parameters
- On-Device-TTS: vollständige Privatsphäre, keine Netzwerklatenz
- Einfache Bereitstellung: läuft in Browsern, auf PCs, Mobilgeräten, Raspberry Pi usw.
- 10 Preset-Stimmen enthalten
- Offenes Modell: kommerzielle Nutzung möglich (OpenRAIL-M)
3 Kommentare
Im Vergleich zu anderen leichten Modellen ist es ziemlich stabil.
Oh, das sollte ich wohl mal auf dem Pi 5 testen.
Ich habe auf dem Home-Agent bereits
supertonicverwendet, und auch die bisherige Version war nicht schlecht, aber offenbar wurde sie aktualisiert. Ich sollte sie mal testen.