5 Punkte von akamotaco 19 일 전 | Noch keine Kommentare. | Auf WhatsApp teilen

Ich interessiere mich für Standalone-Edge-Device-AI.

Der RK3576-Chipsatz verfügt über eine NPU mit 6 TOPS. Während man gelegentlich leichtgewichtige englische TTS-Modelle sieht, gibt es koreanische TTS-Modelle kaum.

Bei MeloTTS-ko war die Nutzung auf Koreanisch durch eine direkte RKNN-Konvertierung möglich, allerdings ließ sich der Encoder nicht in RKNN konvertieren und die Geschwindigkeit war auch nicht besonders hoch.

Deshalb habe ich ein leichtgewichtiges koreanisches TTS-Modell entwickelt, das auch auf Edge-Geräten einsetzbar ist und bei dem der Fokus eher auf Geschwindigkeit als auf Qualität liegt.

Die Ausgabe klingt zwar unnatürlich und maschinell, aber eine Sprachsynthese auf Echtzeitniveau ist möglich. (bezogen auf den RK3576)

Da ich es unter Apache 2.0 veröffentlicht habe, wollte ich es hier teilen, falls es jemandem hilft, der für Edge-Geräte nach koreanischem TTS sucht, bei dem Geschwindigkeit wichtiger ist als Qualität.

Noch keine Kommentare.

Noch keine Kommentare.