- An Beispielen, in denen Spotifys AI-DJ-Funktion klassische Musik nicht richtig erkennt, werden die Grenzen von AI und die Probleme von Musik-Metadaten sichtbar
- Als ein Nutzer nach „Beethovens 7. Symphonie“ fragt, versteht die AI weder die Struktur des Werks noch die Reihenfolge der Sätze und spielt stattdessen einen falschen Satz oder sogar Stücke anderer Komponisten ab
- Selbst auf die konkrete Anweisung „Spiele alle Sätze der Reihe nach ab“ reagiert die AI mit falschen Symphonien oder in der Reihenfolge vermischten Aufnahmen und liefert inkonsistente Ergebnisse
- Die grundlegende Ursache dieser Fehler liegt darin, dass digitale Musik-Metadaten auf Popmusik ausgerichtet entworfen wurden und Konzepte wie Komponist, Werk und Satz nicht angemessen abbilden
- Der Text zeigt die Kluft zwischen Erwartungen an die „Intelligenz“ von AI und der Realität auf und endet mit der zynischen Schlussfolgerung, dass die Bewahrung der westlichen Musiktradition nichts mit Unternehmensinteressen zu tun hat
Nutzungserfahrung mit dem AI DJ und Problembewusstsein
- Der Text beginnt mit der Frage „Ist AI wirklich intelligent?“ und wirft damit die grundsätzliche Frage auf, ob Programmierer für Fehler der AI verantwortlich sind
- Beim Versuch, mit der AI-DJ-Funktion der Spotify-App nach klassischer Musik zu suchen, bestätigt sich erneut die Begrenztheit der bestehenden Spotify-Suchstruktur
- Der Autor beschreibt sich als Hörer, der nicht Popmusik, sondern die 500-jährige westliche Musiktradition bevorzugt, und nennt als Beispiele Komponisten von Tallis bis Shaw
Strukturelle Grenzen digitaler Musik-Metadaten
- Die Metadaten digitaler Musikdateien bestehen aus den drei Tags Artist, Album, Song, was eine auf Popmusik zentrierte Gestaltung widerspiegelt
- Es wird kritisiert, dass der Begriff „Song“ selbst für Instrumentalstücke verwendet wird, obwohl im Bereich klassischer Musik „composition“ oder „work“ treffender wäre
- Das für klassische Musik zentrale Strukturmerkmal des „Satzes“ (
movement) wird in den Metadaten nicht berücksichtigt, weshalb Spotify die Gesamtstruktur eines Werks nicht erkennen kann
Wiedergabeexperiment mit Beethovens 7. Symphonie
- Auf den Befehl „Play Beethoven’s 7th Symphony“ spielt die AI nur den 2. Satz Allegretto ab und danach völlig unzusammenhängende Stücke
- Auch auf die Anfrage „Play Beethoven’s 7th Symphony in its entirety“ erkennt die AI das Werk fälschlich als „9 Minuten langes Gesamtwerk“ und spielt erneut nur den 2. Satz
- Beim Befehl „Play Beethoven’s 7th Symphony from beginning to end“ passiert dasselbe: nur der 2. Satz, danach ein Wechsel zu einem Stück von John Field
- Auf die Anweisung „Play all four movements“ beginnt die AI zwar mit dem 1. Satz, mischt dann aber Aufnahmen verschiedener Orchester und vertauscht die Reihenfolge
- Bei „Play all four movements in numerical order“ entsteht ein völlig falsches Ergebnis, das etwa mit dem 1. Satz der 3. Symphonie beginnt
Mangelndes Musikverständnis der AI
- Es wird hervorgehoben, dass die AI weder die Satzstruktur eines Werks noch das Konzept einer Reihenfolge versteht
- Obwohl man schon aus dem ersten Satz von Wikipedia entnehmen könnte, dass Beethovens Symphonien aus vier Sätzen bestehen, setzt die AI dieses Wissen nicht um
- Der Autor vergleicht diese Fehler mit dem Vorlesen des letzten Kapitels eines Hörbuchs vor dem Anfang und verspottet damit die Ahnungslosigkeit der AI
Fazit: Der Bruch zwischen AI und Musiktradition
- Der Text äußert Skepsis gegenüber der Behauptung, AI könne Musik „komponieren“, und kritisiert, dass eine AI, die nicht einmal Grundbegriffe versteht, schwerlich über Kreativität sprechen kann
- Zwar wird eingeräumt, dass sich Spotifys DJ noch in der Beta-Phase befindet, doch endet der Text mit dem realistischen Pessimismus, dass Unternehmen keinen Anreiz haben, die westliche Musiktradition zu bewahren
- Insgesamt wird das Problem als Zusammenspiel von technischen Grenzen der AI, Verzerrungen im Metadaten-Design und kultureller Gleichgültigkeit dargestellt
1 Kommentare
Hacker-News-Kommentare
Das ist kein AI-Problem, sondern ein Problem des Produktdesigns. Spotify DJ ist im Grunde nur „Shuffle + Sprachansage“, und es ist gut möglich, dass es absichtlich Code gibt, der das Abspielen ganzer Alben verhindert.
AI als ein einheitliches Konzept zu verallgemeinern, ist ein falscher Ansatz. Die Logik „Wenn diese Funktion nicht geht, ist AI nutzlos“ ist ein category error.
Der ganze Text vermischt mehrere Argumente und wirkt dadurch verwirrend, und die Hälfte besteht nur aus einer Aufzählung klassischer Werktitel. Dass Spotify DJ schlecht ist, sehe ich auch so, aber das ist keine überzeugende Art der Kritik.
Es gibt keinen wirklichen Versuch, die Vor- und Nachteile der Technik auszuloten; stattdessen wird von einem engen Einzelfall auf AI insgesamt herabgeschlossen, ein typisches Muster. AI ist nicht menschlich, also sind Grenzen selbstverständlich.
Ähnliches sehe ich bei AI-Coding-Assistenten. Wegen Sicherheitsproblemen werden sie pauschal abgelehnt, während die Möglichkeit, „mit einem einzigen Satz eine native Mac-App zu bauen“, ignoriert wird.
Der Reiz von YouTube-DJ-Mixes wie bei Hör Berlin liegt in der Auswahl und Interpretation des DJs sowie in dessen kulturellem Hintergrund. Wenn AI nur eine optimierte Liste zusammenstellt, geht genau dieses Wesen verloren.
Spotify nutzt aus Kostengründen eine Mischform aus radioähnlichen und interaktiven Lizenzen. Da eine AI-generierte Playlist keine direkte Nutzerwahl ist, könnte sie als radioähnlich behandelt werden.
Ich höre gern Sender wie dublab, NTS1 oder NTS2, weil man dort auf unerwartete Musik stößt.
Selbst mit Investitionen von Hunderten Millionen Dollar waren perfekte Empfehlungen nicht möglich, und der social proof menschlicher DJs konnte nicht ersetzt werden.
Schade auch, dass Musik dort nur als Pop und westliche Klassik begriffen wird.
Ich sehe das als Scheitern des Prompt-Designs. Wenn man dieselbe Anfrage mit diesem ChatGPT-Beispiel testet, reagiert die AI korrekt.
Das spricht dafür, dass entweder Spotifys Modell schwach ist oder der interne Prompt in die falsche Richtung lenkt.
Auch die Behauptung „AI kann keine Musik komponieren“ ist ein falscher Vergleich. AI hat bereits gezeigt, dass sie Musiktheorie verstehen und prinzipiell komponieren kann. Am Ende geht es um Qualität und Geschmack.
Jedes Mal, wenn Menschen LLMs einfach „AI“ nennen, verzerrt das die Wahrnehmung.
Das ist vielleicht der größte Erfolg des Marketings — und einer der größten Schäden, die es der Welt zugefügt hat.