8 Punkte von xguru 2025-02-19 | 2 Kommentare | Auf WhatsApp teilen

Was ist Audiblez?

  • Ein Tool zur Umwandlung von .epub-E-Books in .m4b-Hörbücher
  • Nutzt hochwertige Sprachsynthese auf Basis von Kokoro-82M
  • Wird unter der Apache-Lizenz bereitgestellt und mit weniger als 100 Stunden Audiodaten trainiert
  • Kann auf der T4-GPU von Google Colab bei einer „Umwandlungsgeschwindigkeit von 600 Zeichen pro Sekunde“ Animal Farm in etwa 5 Minuten umwandeln
  • Auf einem M2 MacBook Pro (CPU-Modus) dauert es bei „60 Zeichen pro Sekunde etwa 1 Stunde“
    • Auf Apple Silicon (M1, M2) gibt es derzeit keine CUDA-Unterstützung (MLX-Unterstützung steht noch aus)

Wichtige Updates in Audiblez 4.2

  • Unterstützung für eine plattformübergreifende GUI auf Basis von wxWidgets (Mac, Windows, Linux)
  • Unterstützung für verschiedene Sprachen (Englisch, Spanisch, Französisch, Hindi, Italienisch, Japanisch, Portugiesisch, Chinesisch)
  • Wechsel von ONNX zu einem Torch-basierten Ansatz mit dem Paket kokoro
  • Unterstützung für CUDA-Beschleunigung (auf Apple Silicon läuft es jedoch im CPU-Modus)
  • Einbindung von Cover-Bildern und Kapitel-Zeitstempeln in Hörbücher
  • Verbesserte Windows-Unterstützung

2 Kommentare

 
xguru 2025-02-19

E-Books mit dem Kokoro-82M-Modell in Hörbücher umwandeln
Darauf basiert es, aber das darin enthaltene Koreanisch gibt es in Audiblez nicht. (In den Kommentaren wird allerdings auch gesagt, dass die Koreanisch-Qualität von Kokoro nicht besonders gut ist.)

 
inosphe 2025-02-19

Wenn man sich frühere Aufzeichnungen des kokoro-Projekts ansieht, gab es dort eindeutig eine koreanische Stimme. Den Diskussionen auf Discord nach zu urteilen, scheint die Verbreitung jedoch wegen der Klausel des koreanischen AI Hub, die den Export von Daten ins Ausland verbietet, auf Schwierigkeiten zu stoßen …