22 Punkte von rbynddd 2026-05-15 | 4 Kommentare | Auf WhatsApp teilen
  • Unterstützt 31 Sprachen inklusive Koreanisch
  • Neue Unterstützung für Emotions-Tags: 10 Tags wie <laugh>, <breath>, <scream> können in den Text eingefügt werden, um Emotionen auszudrücken
  • Qualitätsverbesserungen: höhere Aussprachegenauigkeit, weniger Fehler durch Wortwiederholungen/-auslassungen, verbesserte Voice-Cloning-Leistung
  • Modellgröße: 99M Parameters
  • On-Device-TTS: vollständige Privatsphäre, keine Netzwerklatenz
  • Einfache Bereitstellung: läuft in Browsern, auf PCs, Mobilgeräten, Raspberry Pi usw.
  • 10 Preset-Stimmen enthalten
  • Offenes Modell: kommerzielle Nutzung möglich (OpenRAIL-M)

4 Kommentare

 
netcleaner 2026-05-16

Ich frage mich, ob es nicht schwierig ist, statt nur der 10 Presets eine eigene Stimme zu erstellen.

 
hshim 2026-05-15

Im Vergleich zu anderen leichten Modellen ist es ziemlich stabil.

 
greekr4 2026-05-15

Oh, das sollte ich wohl mal auf dem Pi 5 testen.

 
dbs0829 2026-05-15

Ich habe auf dem Home-Agent bereits supertonic verwendet, und auch die bisherige Version war nicht schlecht, aber offenbar wurde sie aktualisiert. Ich sollte sie mal testen.