- Kann Geräusche wie „Ein Hund bellt im Park“, „Pfeifen bei windigem Wetter“ oder „Ein Mann hält eine Rede vor vielen jubelnden Menschen“ erzeugen
- Die Audioerzeugung bringt verschiedene Herausforderungen mit sich
- Es ist schwierig, Objekte, die Geräusche erzeugen, voneinander zu trennen. Durch die unterschiedlichen Aufnahmebedingungen in realen Umgebungen wird dies noch komplexer, und wegen mangelnder Annotationen für solche Situationen ist das Skalieren des Modells schwierig.
- Um diese Probleme zu entschärfen, wird eine Augmentationstechnik vorgeschlagen, die verschiedene Audiosamples mischt und das Modell intern lernen lässt, mehrere Quellen voneinander zu trennen.
Noch keine Kommentare.