22 Punkte von xguru 2024-07-06 | 6 Kommentare | Auf WhatsApp teilen
  • Entfernt Hintergrundgeräusche aus Filmen, Podcasts, Interviews usw. und extrahiert nur die Stimme sauber
  • Unterstützt Dateien bis maximal 500 MB und Audiodauer von bis zu 1 Stunde
  • Nicht für Musikgesang konzipiert oder optimiert (je nach Inhalt kann es dennoch funktionieren)
  • Eine API für Echtzeit-Streaming wurde noch nicht veröffentlicht, soll aber bald erscheinen
  • Die Nutzung kostet 1000 Zeichen pro Audiominute

6 Kommentare

 
savvykang 2024-07-06

Wie viel kostet Voice Isolator?
Voice Isolator kostet 1000 Zeichen pro Audiominute.

Was bedeutet das? Ich verstehe nicht, warum hier eine Zeichenzahl auftaucht.

 
brainer 2024-07-06

Ist das nicht ein ähnliches Konzept wie Tokens?

So wie bei GPT auch Bilder ähnlich wie Text-Tokens berechnet werden.

 
savvykang 2024-07-06

Wenn man sich die anderen Dienste des Unternehmens ansieht, versteht man das. Es scheint nach dem Prinzip Speech-to-Text-to-Speech zu funktionieren, deshalb wird offenbar der zwischengelagerte Text berechnet.

 
qyurila 2024-07-06

Andererseits bietet auch MVSep, das kostenpflichtig und kostenlos Vocal-Separation über verschiedene Open-Modelle anbietet, mehrere Arten von Sprach-/Geräuschtrennungsmodellen an.
https://mvsep.com

 
xguru 2024-07-06

Adobe Podcast AI bietet ebenfalls eine ähnliche Funktion. Es scheint auch eine kostenlose Version zu geben: https://podcast.adobe.com/enhance

 
brainer 2024-07-06

In der kostenlosen Version wirkt es so, als wäre Koreanisch nicht optimal unterstützt ..