9 Punkte von GN⁺ 2024-04-05 | 3 Kommentare | Auf WhatsApp teilen

3 Kommentare

 
kyunghoon 2024-04-06

Inzwischen klingen koreanische Lieder, die von KI gesungen werden, überhaupt nicht mehr unnatürlich.
https://www.youtube.com/watch?v=P5g5XGmhxOo

 
xguru 2024-04-05

Ich habe mir kürzlich ein paar Songs angehört, die mit Suno erstellt wurden, und selbst mit koreanischen Liedtexten erzeugt es erstaunlich passende Ergebnisse.

 
GN⁺ 2024-04-05
Hacker-News-Kommentare
  • Mein wachsendes Interesse an Sprachsynthesizern und TTS-Systemen sowie an NLP im Allgemeinen war einer der Hauptgründe, warum ich Informatik und Computerlinguistik studiert habe. Diese Technologien waren während meiner Studienzeit die scheinbar unmögliche Science-Fiction, von der ich geträumt hatte, und ich kann nur staunen, wie schnell sich dieses Feld heute entwickelt. suno.ai kann sogar abgehackte, roboterhafte Sprache imitieren.
  • Mir ist aufgefallen, dass suno.ai einige Wörter auf interessante Weise verfremdet ausspricht. Zum Beispiel wird "sublicence" zu "sublissence", "fitness" zu "fisted", "infringement" zu "infring-ment" und "liable" zu "liar-ful". Außerdem klingen die Tonhöhenwechsel der Stimme so, als wären sie Auto-Tune-bearbeitet oder elektronisch verfremdet. Ich erwarte, dass es Experten geben wird, die AI-generierte Vocals erkennen.
  • Die Aussprache des Wortes "software" war lustig.
  • Seit GPT-4 hat mich AI nicht mehr so überrascht. Als nicht professioneller Musiker würde ich empfehlen, Suno.ai auszuprobieren. Diese Technologie könnte ein Ersatz für Musik-Abodienste werden und für Profis ein Schock sein.
  • In dieser Diskussion liegt der Fokus auf Sprachsynthese. Andere Kommentatoren haben die wichtigen Punkte bereits angesprochen, daher erwähne ich sie nicht noch einmal. Musikalisch ist das System noch weit davon entfernt, etwas wirklich Interessantes zu erzeugen. Harmonie, Tempo, Struktur, Dynamik – alles wirkt chaotisch und ohne Aufbau. Mit rein generativen Modellen allein wird es schwer, ein höheres Niveau zu erreichen. Vielleicht braucht es einen gemischten regelbasierten und generativen Ansatz.
  • Ich habe einen von Claude Sonnet komponierten Song in Suno bearbeitet; der Stil passte nicht, aber das Ergebnis war ziemlich gut.
  • Ich habe den Litanei der Furcht aus Dune mit Bing Chat so umgeschrieben, dass sie vom Kampf gegen Code-Komplexität handelt, und dann mit suno.ai einen zweiminütigen Song daraus gemacht, der Gefühle über Code ausdrückt, der vereinfacht werden muss.
  • Ich habe die Angewohnheit, beim Lesen innerlich zu flüstern, und wenn mir ein Lied im Kopf herumgeht, habe ich die seltene Neigung, mir vorzustellen, dass jemand die Wörter, die ich lese, zur Melodie dieses Liedes singt.
  • Das Mädchen ist traurig, weil es die Namen der Personen oder Künstler nicht kennt, nach denen Musik und Stimme modelliert wurden.
  • Ich war beeindruckt davon, dass aus der Lizenz ein Reimgefühl herausgeholt wurde.