Supertonic 3 – ultraleichtes On-Device-TTS veröffentlicht, unterstützt 31 Sprachen und Emotions-Tags
(github.com/supertone-inc)- Unterstützt 31 Sprachen inklusive Koreanisch
- Neue Unterstützung für Emotions-Tags: 10 Tags wie
<laugh>,<breath>,<scream>können in den Text eingefügt werden, um Emotionen auszudrücken - Qualitätsverbesserungen: höhere Aussprachegenauigkeit, weniger Fehler durch Wortwiederholungen/-auslassungen, verbesserte Voice-Cloning-Leistung
- Modellgröße: 99M Parameters
- On-Device-TTS: vollständige Privatsphäre, keine Netzwerklatenz
- Einfache Bereitstellung: läuft in Browsern, auf PCs, Mobilgeräten, Raspberry Pi usw.
- 10 Preset-Stimmen enthalten
- Offenes Modell: kommerzielle Nutzung möglich (OpenRAIL-M)
4 Kommentare
Ich frage mich, ob es nicht schwierig ist, statt nur der 10 Presets eine eigene Stimme zu erstellen.
Im Vergleich zu anderen leichten Modellen ist es ziemlich stabil.
Oh, das sollte ich wohl mal auf dem Pi 5 testen.
Ich habe auf dem Home-Agent bereits
supertonicverwendet, und auch die bisherige Version war nicht schlecht, aber offenbar wurde sie aktualisiert. Ich sollte sie mal testen.