1 Punkte von GN⁺ 2026-03-16 | 1 Kommentare | Auf WhatsApp teilen
  • An Beispielen, in denen Spotifys AI-DJ-Funktion klassische Musik nicht richtig erkennt, werden die Grenzen von AI und die Probleme von Musik-Metadaten sichtbar
  • Als ein Nutzer nach „Beethovens 7. Symphonie“ fragt, versteht die AI weder die Struktur des Werks noch die Reihenfolge der Sätze und spielt stattdessen einen falschen Satz oder sogar Stücke anderer Komponisten ab
  • Selbst auf die konkrete Anweisung „Spiele alle Sätze der Reihe nach ab“ reagiert die AI mit falschen Symphonien oder in der Reihenfolge vermischten Aufnahmen und liefert inkonsistente Ergebnisse
  • Die grundlegende Ursache dieser Fehler liegt darin, dass digitale Musik-Metadaten auf Popmusik ausgerichtet entworfen wurden und Konzepte wie Komponist, Werk und Satz nicht angemessen abbilden
  • Der Text zeigt die Kluft zwischen Erwartungen an die „Intelligenz“ von AI und der Realität auf und endet mit der zynischen Schlussfolgerung, dass die Bewahrung der westlichen Musiktradition nichts mit Unternehmensinteressen zu tun hat

Nutzungserfahrung mit dem AI DJ und Problembewusstsein

  • Der Text beginnt mit der Frage „Ist AI wirklich intelligent?“ und wirft damit die grundsätzliche Frage auf, ob Programmierer für Fehler der AI verantwortlich sind
  • Beim Versuch, mit der AI-DJ-Funktion der Spotify-App nach klassischer Musik zu suchen, bestätigt sich erneut die Begrenztheit der bestehenden Spotify-Suchstruktur
  • Der Autor beschreibt sich als Hörer, der nicht Popmusik, sondern die 500-jährige westliche Musiktradition bevorzugt, und nennt als Beispiele Komponisten von Tallis bis Shaw

Strukturelle Grenzen digitaler Musik-Metadaten

  • Die Metadaten digitaler Musikdateien bestehen aus den drei Tags Artist, Album, Song, was eine auf Popmusik zentrierte Gestaltung widerspiegelt
  • Es wird kritisiert, dass der Begriff „Song“ selbst für Instrumentalstücke verwendet wird, obwohl im Bereich klassischer Musik „composition“ oder „work“ treffender wäre
  • Das für klassische Musik zentrale Strukturmerkmal des „Satzes“ (movement) wird in den Metadaten nicht berücksichtigt, weshalb Spotify die Gesamtstruktur eines Werks nicht erkennen kann

Wiedergabeexperiment mit Beethovens 7. Symphonie

  • Auf den Befehl „Play Beethoven’s 7th Symphony“ spielt die AI nur den 2. Satz Allegretto ab und danach völlig unzusammenhängende Stücke
  • Auch auf die Anfrage „Play Beethoven’s 7th Symphony in its entirety“ erkennt die AI das Werk fälschlich als „9 Minuten langes Gesamtwerk“ und spielt erneut nur den 2. Satz
  • Beim Befehl „Play Beethoven’s 7th Symphony from beginning to end“ passiert dasselbe: nur der 2. Satz, danach ein Wechsel zu einem Stück von John Field
  • Auf die Anweisung „Play all four movements“ beginnt die AI zwar mit dem 1. Satz, mischt dann aber Aufnahmen verschiedener Orchester und vertauscht die Reihenfolge
  • Bei „Play all four movements in numerical order“ entsteht ein völlig falsches Ergebnis, das etwa mit dem 1. Satz der 3. Symphonie beginnt

Mangelndes Musikverständnis der AI

  • Es wird hervorgehoben, dass die AI weder die Satzstruktur eines Werks noch das Konzept einer Reihenfolge versteht
  • Obwohl man schon aus dem ersten Satz von Wikipedia entnehmen könnte, dass Beethovens Symphonien aus vier Sätzen bestehen, setzt die AI dieses Wissen nicht um
  • Der Autor vergleicht diese Fehler mit dem Vorlesen des letzten Kapitels eines Hörbuchs vor dem Anfang und verspottet damit die Ahnungslosigkeit der AI

Fazit: Der Bruch zwischen AI und Musiktradition

  • Der Text äußert Skepsis gegenüber der Behauptung, AI könne Musik „komponieren“, und kritisiert, dass eine AI, die nicht einmal Grundbegriffe versteht, schwerlich über Kreativität sprechen kann
  • Zwar wird eingeräumt, dass sich Spotifys DJ noch in der Beta-Phase befindet, doch endet der Text mit dem realistischen Pessimismus, dass Unternehmen keinen Anreiz haben, die westliche Musiktradition zu bewahren
  • Insgesamt wird das Problem als Zusammenspiel von technischen Grenzen der AI, Verzerrungen im Metadaten-Design und kultureller Gleichgültigkeit dargestellt

1 Kommentare

 
GN⁺ 2026-03-16
Hacker-News-Kommentare
  • Es wirkt so, als hätte der Autor trotz technischem Hintergrund einen merkwürdigen Text geschrieben.
    Das ist kein AI-Problem, sondern ein Problem des Produktdesigns. Spotify DJ ist im Grunde nur „Shuffle + Sprachansage“, und es ist gut möglich, dass es absichtlich Code gibt, der das Abspielen ganzer Alben verhindert.
    AI als ein einheitliches Konzept zu verallgemeinern, ist ein falscher Ansatz. Die Logik „Wenn diese Funktion nicht geht, ist AI nutzlos“ ist ein category error.
    Der ganze Text vermischt mehrere Argumente und wirkt dadurch verwirrend, und die Hälfte besteht nur aus einer Aufzählung klassischer Werktitel. Dass Spotify DJ schlecht ist, sehe ich auch so, aber das ist keine überzeugende Art der Kritik.
    • Charles Petzold ist nicht einfach nur ein Techniker, sondern der maßgebliche Autor zu Win32 und MFC. Ihn bloß als „Techniker“ zu bezeichnen, ist ungefähr so, als würde man Donald Knuth einen „Dozenten“ nennen.
    • Die Produktorganisation von Spotify ist massiv ineffizient. Die Funktionen in der Desktop- und Mobile-App unterscheiden sich ständig, und in CarPlay ist es oft viel schneller, einfache Dinge direkt am Handy zu erledigen.
    • Es wirkt, als hätte der Autor absichtlich auf Ragebait gesetzt. Die Logik „AI kann keine Musik komponieren“ ist ungefähr so absurd wie „Ein LLM kann keine grammatikalisch korrekten Sätze bilden, weil es die Anzahl der Rs in einem Wort nicht zählen kann“.
    • Ich sehe es eher umgekehrt. Gerade weil das technisch problemlos möglich sein sollte und trotzdem so ein Ergebnis herauskommt, vermittelt der Text gut die Botschaft: „Dafür gibt es keine Entschuldigung.“
    • Weniger ein „category error“ als eher begging the question. DJ-Funktion und Kompositionsfähigkeit werden auf dieselbe Ebene gestellt, und die Schlussfolgerung wird schon vorab vorausgesetzt.
  • Ich habe AI DJ zwar nicht selbst benutzt, aber mit der Kritik des Autors kann ich mich schwer anfreunden.
    Es gibt keinen wirklichen Versuch, die Vor- und Nachteile der Technik auszuloten; stattdessen wird von einem engen Einzelfall auf AI insgesamt herabgeschlossen, ein typisches Muster. AI ist nicht menschlich, also sind Grenzen selbstverständlich.
    Ähnliches sehe ich bei AI-Coding-Assistenten. Wegen Sicherheitsproblemen werden sie pauschal abgelehnt, während die Möglichkeit, „mit einem einzigen Satz eine native Mac-App zu bauen“, ignoriert wird.
    • „Was AI kann“ und „was AI-Evangelisten behaupten“ sind zwei völlig verschiedene Dinge. Auf Fragen nach Grenzen antworten sie oft nur mit „Man muss AI noch mehr einsetzen“ oder „In fünf Jahren ist das alles gelöst“. Solche überzogenen Versprechen zerstören Vertrauen.
    • Das Beispiel „eine App mit einem Satz bauen“ ist in der Praxis schwer verlässlich, weil die Qualität probabilistisch ist.
    • Tatsächlich ist es unmöglich, mit nur einem Satz eine fertige App zu erzeugen, wenn sie über Hello World hinausgeht. Nacharbeit und Korrekturen sind unvermeidlich.
    • Die Produktkritik an Spotify beiseitezuschieben und stattdessen auf das Thema „Mac-App mit einem Satz“ auszuweichen, ist eine merkwürdige Argumentation.
    • Ich stimme der Verallgemeinerung auf AI nicht zu, aber Spotify DJ ist wirklich ein miserables Produkt. Mit Claude Code ist das nicht vergleichbar.
  • AI DJ fühlt sich an wie AI, die Restaurantkritiken schreibt. Das ist zwar möglich, aber Menschen wollen eher den Geschmack menschlicher Experten als die Meinung einer Maschine.
    Der Reiz von YouTube-DJ-Mixes wie bei Hör Berlin liegt in der Auswahl und Interpretation des DJs sowie in dessen kulturellem Hintergrund. Wenn AI nur eine optimierte Liste zusammenstellt, geht genau dieses Wesen verloren.
    • Die Zukunft wird ein Zeitalter der Kuratierung sein. Menschliche Kuratoren mit tiefem Wissen und Gespür werden eher noch wertvoller werden.
    • Spotifys Mixe unterscheiden sich seit 10 Jahren kaum. Ein DJ wählt irgendeinen Mix aus, und ein LLM fügt ein paar Ansagen hinzu. Am Ende ist es nur ein ML-Empfehlungssystem.
    • Ich entdecke gerne neue Musik über automatische Listen auf SoundCloud. Es ist nicht perfekt, aber es hat den Reiz einer gezielten Erkundung.
    • Ein menschlicher DJ, der bei einem echten Auftritt die Reaktion des Publikums liest, und ein Spotify DJ sind völlig verschiedene Dinge. Letzterer ist nur Shuffle mit ein paar LLM-Ansagen.
    • Natürlich gibt es auch Menschen, die Kunst als Werk an sich konsumieren. Die Existenz eines menschlichen Kurators ist nicht zwingend nötig.
  • Das Kernproblem ist die Struktur der Musiklizenzen. Bei radioähnlichen Lizenzen können Nutzer keine Tracks direkt auswählen, und auch das vollständige Abspielen eines Albums ist eingeschränkt.
    Spotify nutzt aus Kostengründen eine Mischform aus radioähnlichen und interaktiven Lizenzen. Da eine AI-generierte Playlist keine direkte Nutzerwahl ist, könnte sie als radioähnlich behandelt werden.
  • Wenn der Schwerpunkt auf klassischer Musik liegt, ist ein Wechsel zu Apple Music Classical deutlich besser. PDF-Booklets, Vergleich nach Interpreten, Navigationsfunktionen — in jeder Hinsicht überlegen.
    • Ich finde Apple Music Classical oder Idagio deutlich besser. Spotify kümmert sich nicht groß um den Klassikmarkt, weil er klein ist.
  • Empfehlungsdienste wie Spotify sind langweilig. Die Musikauswahl menschlicher DJs ist viel interessanter.
    Ich höre gern Sender wie dublab, NTS1 oder NTS2, weil man dort auf unerwartete Musik stößt.
    • Das größte Problem von AI-Kuratierung ist die Qualität der Eingangsdaten. Ähnlichkeitsbasiert, zufallsbasiert, musterorientiert — alles hat Grenzen. Letztlich lässt sich die Vielfalt menschlicher Vorlieben damit nicht erfassen.
      Selbst mit Investitionen von Hunderten Millionen Dollar waren perfekte Empfehlungen nicht möglich, und der social proof menschlicher DJs konnte nicht ersetzt werden.
    • In der Forschung zu Empfehlungssystemen nennt man das das Serendipity-Problem. Gleichzeitig Relevanz und Überraschung zu maximieren, ist eine sehr schwierige Aufgabe.
    • Ich mache lieber selbst Mixtapes oder höre gemischte MP3s, die ich von CDs gerippt habe. Um Fremdsprachen nicht zu verlernen, höre ich auch europäisches Radio, und Kanäle wie YouTube, KEXP oder Tiny Desk mag ich ebenfalls.
    • NTS ist wirklich großartig. Streaming-Algorithmen wirken meistens so, als seien sie nur für Hintergrundgeräusche optimiert.
    • Danke für die Empfehlung. Ich habe NTS angemacht und höre jetzt einfach weiter. Weitere Tipps sind willkommen.
  • Schon am Anfang des Textes wirkte die Aufzählung klassischer Komponisten so prätentiös, dass ich das Interesse verloren habe. Schon das Wort DJ passt eher zu moderner elektronischer Musik.
    • In Formulierungen wie „that moste illustriouse of musical traditionnes“ steckt eine übertriebene Pose.
    • Ein DJ ist jemand, der auf Hochzeiten oder im Club Pop- oder Dance-Tracks spielt, nicht jemand, der Bach oder Vivaldi mixt.
    • Es wirkte fast so, als hätte AI automatisch eine Komponistenliste erzeugt.
    • Das hatte ich auch so empfunden. Dazu kommt dieses alberne Nachschieben, dass „die Leute das wahrscheinlich nicht kennen werden“.
    • Zuerst dachte ich, es sei ein Witz, aber dann blieb der Text durchgehend ernst. Ich habe Windows-Programmierung mit Petzolds Büchern gelernt und war überrascht von Aussagen, die so wirken, als kenne er nicht einmal die Grundprinzipien von Transformer-Modellen.
      Schade auch, dass Musik dort nur als Pop und westliche Klassik begriffen wird.
  • Bei dem Satz über die „Säulen der westlichen Zivilisation“ wurde das Lesen mühsam. Das Fazit ist letztlich banal — Spotify passt nicht zu Klassik, also sollte man einen anderen Dienst nutzen.
  • Die Kernfrage des Textes war: „Wer trägt die Verantwortung, wenn AI sich dumm verhält?“
    Ich sehe das als Scheitern des Prompt-Designs. Wenn man dieselbe Anfrage mit diesem ChatGPT-Beispiel testet, reagiert die AI korrekt.
    Das spricht dafür, dass entweder Spotifys Modell schwach ist oder der interne Prompt in die falsche Richtung lenkt.
    Auch die Behauptung „AI kann keine Musik komponieren“ ist ein falscher Vergleich. AI hat bereits gezeigt, dass sie Musiktheorie verstehen und prinzipiell komponieren kann. Am Ende geht es um Qualität und Geschmack.
    • Wenn der Prompt in Richtung „mit ähnlichen Künstlern weitermachen“ geht, könnte dahinter auch eine Geschäftslogik stecken, die auf titel mit niedrigeren Lizenzkosten lenkt.
    • Die Verantwortung auf den Nutzer abzuwälzen, ist unerquicklich. Der Prompt war klar. Diese Art der Ausbreitung der AI-Industrie macht die Welt eher dümmer und eintöniger.
  • Dieser Text ist ein gutes Beispiel für linguistische Relativität, also dafür, dass Sprache das Denken prägt.
    Jedes Mal, wenn Menschen LLMs einfach „AI“ nennen, verzerrt das die Wahrnehmung.
    Das ist vielleicht der größte Erfolg des Marketings — und einer der größten Schäden, die es der Welt zugefügt hat.