ElevenLabs Voice Isolator – Nur die Stimme sauber isolieren
(elevenlabs.io)- Entfernt Hintergrundgeräusche aus Filmen, Podcasts, Interviews usw. und extrahiert nur die Stimme sauber
- Unterstützt Dateien bis maximal 500 MB und Audiodauer von bis zu 1 Stunde
- Nicht für Musikgesang konzipiert oder optimiert (je nach Inhalt kann es dennoch funktionieren)
- Eine API für Echtzeit-Streaming wurde noch nicht veröffentlicht, soll aber bald erscheinen
- Die Nutzung kostet 1000 Zeichen pro Audiominute
6 Kommentare
Was bedeutet das? Ich verstehe nicht, warum hier eine Zeichenzahl auftaucht.
Ist das nicht ein ähnliches Konzept wie Tokens?
So wie bei GPT auch Bilder ähnlich wie Text-Tokens berechnet werden.
Wenn man sich die anderen Dienste des Unternehmens ansieht, versteht man das. Es scheint nach dem Prinzip Speech-to-Text-to-Speech zu funktionieren, deshalb wird offenbar der zwischengelagerte Text berechnet.
Andererseits bietet auch MVSep, das kostenpflichtig und kostenlos Vocal-Separation über verschiedene Open-Modelle anbietet, mehrere Arten von Sprach-/Geräuschtrennungsmodellen an.
https://mvsep.com
Adobe Podcast AI bietet ebenfalls eine ähnliche Funktion. Es scheint auch eine kostenlose Version zu geben: https://podcast.adobe.com/enhance
In der kostenlosen Version wirkt es so, als wäre Koreanisch nicht optimal unterstützt ..