MusicLM, eine KI, die Musik aus Text erzeugt

xguru · 2023-01-31T10:04:01+09:00

Von Google Research veröffentlichte Arbeit Erzeugt Musik, die Textbeschreibungen sehr genau folgt: „Ruhige Violinenmelodie mit einem verzerrten Gitarrenriff im Hintergrund“ Erzeugt mehrere Minuten lange Musik mit 24 kHz, indem die Aufgabe als hierarchische Sequenz-zu-Sequenz-Modellierung formuliert wird Deutlich besser als bestehende Systeme, sowohl bei der Klangqualität als auch bei der Einhaltung der Textbeschreibung Kann auch Melodiestile in Form von Pfeifen oder Summen transformieren Durch die sequenzielle Eingabe mehrerer Prompts ist auch Audioerzeugung im Story-Modus möglich Veröffentlichung des Datensatzes MusicCaps mit 5,5k Musik-Text-Paaren

(google-research.github.io)

14 Punkte von xguru 2023-01-31 | 2 Kommentare | Auf WhatsApp teilen

Von Google Research veröffentlichte Arbeit
Erzeugt Musik, die Textbeschreibungen sehr genau folgt: „Ruhige Violinenmelodie mit einem verzerrten Gitarrenriff im Hintergrund“
Erzeugt mehrere Minuten lange Musik mit 24 kHz, indem die Aufgabe als hierarchische Sequenz-zu-Sequenz-Modellierung formuliert wird
Deutlich besser als bestehende Systeme, sowohl bei der Klangqualität als auch bei der Einhaltung der Textbeschreibung
Kann auch Melodiestile in Form von Pfeifen oder Summen transformieren
Durch die sequenzielle Eingabe mehrerer Prompts ist auch Audioerzeugung im Story-Modus möglich
Veröffentlichung des Datensatzes MusicCaps mit 5,5k Musik-Text-Paaren

2 Kommentare

jin225675 2023-01-31

Es ist wirklich beeindruckend, dass allein aus Text eine so hohe Qualität herauskommen kann!
Allerdings wirkt noch vieles ziemlich unnatürlich, daher könnte ich mir vorstellen, dass es vorerst eher genutzt wird, damit Kreative sich Ideen holen.

xguru 2023-01-31

Riffusion - Stable Diffusion, feinabgestimmt zur Erzeugung von Musik

MusicLM, eine KI, die Musik aus Text erzeugt

Verwandte Beiträge

2 Kommentare