7 Punkte von GN⁺ 2024-05-21 | 9 Kommentare | Auf WhatsApp teilen
  • Erklärung, die Johanssons PR-Vertreter Marcel Pariseau NPR zur Verfügung gestellt hat. Maschinell ins Koreanische übersetzt

    „Im vergangenen September erhielt ich von Sam Altman das Angebot, die Stimme des aktuellen ChatGPT-4.0-Systems zu übernehmen. Er sagte, ich könne dabei helfen, die Kluft zwischen Technologieunternehmen und Kreativen zu überbrücken und dafür zu sorgen, dass sich Verbraucher mit dem tiefgreifenden Wandel in Bezug auf Menschen und KI wohler fühlen. Er sagte auch, meine Stimme könne Menschen Trost spenden.

    Nach langem Überlegen habe ich das Angebot aus persönlichen Gründen abgelehnt. Neun Monate später wiesen meine Freunde und meine Familie sowie die Öffentlichkeit darauf hin, wie sehr ein neues System namens „Sky“ meiner Stimme ähnelte.

    Als ich die veröffentlichte Demo hörte, war ich schockiert, wütend und konnte kaum glauben, dass Herr Altman eine Stimme verfolgt hatte, die meiner so unheimlich ähnlich war, dass selbst meine engsten Freunde und Nachrichtenmedien den Unterschied kaum erkennen konnten. Herr Altman deutete sogar an, dass die Ähnlichkeit beabsichtigt war, indem er das einzige Wort „her“ twitterte und damit auf den Film „Her“ anspielte, in dem ich Samantha, das Stimmmodell eines Chat-Systems, gesprochen habe, das eine intime Beziehung zu einem Menschen eingeht.

    Zwei Tage bevor die ChatGPT-4.0-Demo veröffentlicht wurde, kontaktierte Herr Altman meinen Agenten und bat mich, meine Entscheidung noch einmal zu überdenken. Bevor wir überhaupt miteinander sprechen konnten, war das System bereits veröffentlicht.

    Aufgrund ihres Verhaltens blieb mir nichts anderes übrig, als rechtlichen Rat einzuholen, und mein Anwalt sandte Herrn Altman und OpenAI zwei Schreiben mit der Bitte zu erläutern, was sie getan hatten und wie genau die Stimme „Sky“ erstellt worden war. Daraufhin erklärte sich OpenAI schließlich widerwillig bereit, die Stimme „Sky“ zurückzuziehen.

    In einer Zeit, in der wir alle mit Deepfakes sowie dem Schutz der eigenen Persönlichkeitsrechte, der eigenen Arbeit und der eigenen Identität ringen, bin ich überzeugt, dass diese Fragen absolute Klarheit erfordern. Ich hoffe auf Lösungen in Form der Verabschiedung geeigneter Gesetze zum Schutz von Transparenz und individuellen Rechten.“

9 Kommentare

 
botplaysdice 2024-05-22

Wie wird OpenAI wohl darauf reagieren?

Werden sie dann so etwas sagen wie: „Diese Stimme sind nicht Sie. Das hier ist Ihre Stimme.“ und dabei eine wirklich perfekt kopierte Stimme von Scarlett Johansson vorspielen?

Die Abwicklung ist schon etwas enttäuschend. Vielleicht eine Nebenwirkung von zu viel Selbstvertrauen ...

 
lcanon 2024-05-21

Ich hoffe, das verpasst diesem branchentypischen Spruch „Es ist leichter, um Vergebung zu bitten als um Erlaubnis“ endlich einen ordentlichen Dämpfer. Wenn sie selbst bei einem Hollywood-Star so auftreten, schicken sie bei Protesten von Normalbürgern am Ende vielleicht noch einen Auftragskiller.

 
shalome7 2024-05-21

Ich persönlich denke, dass die Sky-Stimme bereits vor 6 Monaten veröffentlicht wurde und jeder sie über die iOS-App nutzen konnte, ohne dass sie damals als Scarlett Johansson oder Her ähnlich großes Thema geworden wäre ... (auch auf Reddit, HN usw. meinten Leute, die sie ausprobiert haben, dass man sie nicht so sehr mit derselben Stimme verwechseln würde ..) Auch ich merke jetzt, wenn ich Sky bewusst einstelle, natürlich, dass sie eine Stimme mit dem Flair von Scarlett Johansson in Her hat, aber ich finde nicht, dass es dieselbe Stimme ist.
In so einem Fall frage ich mich, ob es wirklich angemessen ist, dass Scarlett Johansson Rechte an der Stimme geltend macht.

Ein früher hochgeladenes Demo: https://www.youtube.com/watch?v=RcgV2u9Kxh0

Wenn man es mit dem Wissen anhört, dass es um Scarlett Johansson geht, klingt es definitiv ähnlich wie Scarlett Johansson ... haha

 
eungook 2024-05-22

Ich hoffe, dass Sie inzwischen Ihre Meinung geändert haben.

 
bbulbum 2024-05-21

Tja … und das von einem Unternehmen, das angeblich die AI-Branche anführt …

 
xguru 2024-05-21

OpenAI hat dazu separat den Beitrag Wie die Stimmen für ChatGPT ausgewählt wurden veröffentlicht.

Der Auswahlprozess für ChatGPT-Stimmen

  • Der Sprachmodus von ChatGPT ist eine der Funktionen, die von Nutzern besonders geschätzt werden
  • Die fünf unverwechselbaren Stimmen (Breeze, Cove, Ember, Juniper, Sky) wurden über einen umfassenden, fünf Monate dauernden Prozess sorgfältig ausgewählt
  • Professionelle Sprecher, Agenturen, Casting-Direktoren und Branchenberater waren daran beteiligt

Unterstützung der Kreativ-Community und Zusammenarbeit mit der Sprecherbranche

  • OpenAI unterstützt die Kreativ-Community und arbeitet für das Casting von Stimmen eng mit der Sprecherbranche zusammen
  • Jeder Sprecher erhält eine Vergütung auf oder über Spitzenniveau des Marktes, solange die Stimme im Produkt verwendet wird
  • Man vertritt die Überzeugung, dass KI-Stimmen nicht absichtlich die unverwechselbare Stimme von Prominenten nachahmen sollten
  • Die Stimme von Sky ist keine Nachahmung von Scarlett Johansson, sondern die natürliche Stimme einer anderen professionellen Schauspielerin
  • Zum Schutz der Privatsphäre der Sprecher werden ihre Namen nicht veröffentlicht

Zusammenarbeit mit preisgekrönten Casting-Direktoren und Produzenten zur Festlegung der Stimmkriterien

  • Anfang 2023 arbeitete man für die Auswahl der Sprecher mit unabhängigen, renommierten und preisgekrönten Casting-Direktoren und Produzenten zusammen
  • Die Kriterien für ChatGPT-Stimmen wurden unter sorgfältiger Berücksichtigung der einzigartigen Persönlichkeit jeder Stimme und ihrer Attraktivität für ein globales Publikum festgelegt
  • Zu den Kriterien gehörten vielfältige Hintergründe oder Mehrsprachigkeit, zeitlose Stimmen, vertrauenswürdige Stimmen sowie warme, ansprechende und selbstbewusste Stimmen

Sprecher und Filmschauspieler mit mehr als 400 Bewerbungen

  • Im Mai 2023 veröffentlichten die Casting-Agentur und die Casting-Direktoren einen Aufruf zur Talentsuche
  • Innerhalb einer Woche gingen mehr als 400 Bewerbungen ein
  • Die Schauspieler absolvierten ihr Vorsprechen, indem sie ein Skript mit ChatGPT-Antworten erhielten und aufnahmen

Auswahl der finalen fünf Stimmen und Diskussion mit den Schauspielern über die Vision der Interaktion mit KI-Stimmen

  • Während des gesamten Mai 2023 prüfte und wählte das Casting-Team 14 Schauspieler unabhängig aus
  • Vor der Einreichung der finalen Kandidatenstimmen an OpenAI wurden zusätzliche Verfeinerungen vorgenommen
  • Mit jedem Schauspieler wurden die Vision der Interaktion mit KI-Stimmen sowie Fähigkeiten, Grenzen, Risiken und Schutzmaßnahmen der Technologie besprochen
  • Es war wichtig, dass die Schauspieler Umfang und Absicht des Sprachmodus verstanden, bevor sie sich dem Projekt verpflichteten
  • Nachdem interne Teams von OpenAI die Stimmen aus Produkt- und Forschungsperspektive geprüft hatten, wurden die finalen Stimmen nach sorgfältiger Abwägung ausgewählt

Einladung der Schauspieler nach San Francisco für Aufnahmen und Veröffentlichung der ChatGPT-Stimmen

  • Im Juni und Juli wurden die Schauspieler für Aufnahmesitzungen und persönliche Treffen mit den Produkt- und Forschungsteams von OpenAI nach San Francisco eingeladen
  • Am 25. September 2023 wurden die Stimmen in ChatGPT veröffentlicht
  • Der gesamte Prozess erstreckte sich über fünf Monate und umfasste eine intensive Zusammenarbeit mit den Schauspielern und dem Casting-Team
  • Für die Audioforschung von GPT-4o und neue Sprachfunktionen arbeitet man weiterhin mit den Schauspielern zusammen

Neuer Sprachmodus von GPT-4o für zahlende Nutzer und Pläne zur Einführung zusätzlicher Stimmen

  • In den kommenden Wochen soll ChatGPT-Plus-Nutzern eine Alpha-Version des neuen Sprachmodus von GPT-4o bereitgestellt werden
  • Mit GPT-4o kann man per Sprache deutlich natürlicher mit ChatGPT interagieren
  • GPT-4o verarbeitet Unterbrechungen nahtlos, verwaltet Gruppengespräche effektiv, filtert Hintergrundgeräusche und passt sich dem Tonfall an
  • Künftig plant man, zusätzliche Stimmen in ChatGPT einzuführen, um unterschiedlichen Interessen und Vorlieben der Nutzer besser gerecht zu werden
 
GN⁺ 2024-05-21
Hacker-News-Diskussion

Zusammenfassung ausgewählter Hacker-News-Kommentare

  • Der Konflikt zwischen OpenAI und Scarlett Johansson

    • OpenAI hatte Scarlett Johansson kontaktiert, sie lehnte jedoch ab. Zwei Tage vor dem Start von GPT-4o kontaktierte OpenAI erneut ihre Agentur, erhielt aber keine Antwort. Schließlich demonstrierte OpenAI ein Produkt, das ihre Stimme nachahmte. Nachdem Johanssons Rechtsteam nachfragte, entfernte OpenAI die betreffende Stimme aus dem Produkt.
  • Das rücksichtslose Verhalten von OpenAI

    • Die Meinung, dass es kein gutes Verhalten sei, dass OpenAI mehrfach versucht habe, Johansson zu engagieren, daran gescheitert sei und dann eine ihrer Stimme nachempfundene Version verwendet habe.
  • Kritik an der ChatGPT-4o-Demo

    • Die Meinung, dass Altmans Versuch, „sie“ zu kopieren, unangenehm sei. Dass Johansson sich gegen eine Mitwirkung entschieden habe, werde als gute Entscheidung bewertet. Außerdem werde dadurch klar, dass die TTS-Engine weiterhin verwendet wird.
  • Mira Muratis Aussage

    • Die Meinung, dass Muratis Aussage bemerkenswert sei, wonach der Sprachmodus von GPT-4o eher von natürlichen Aspekten menschlicher Gespräche als vom Film Her inspiriert worden sei. Dass Murati bei der Frage erstarrte, wirke wie ein Versuch, rechtliche Probleme zu vermeiden.
  • Sams Tweet

    • Die Meinung, dass Sams Tweet Scarlett Johanssons Rechtsteam bereits alle nötigen Beweise geliefert habe.
  • Rechtliche Fragen

    • Dass die Sky-Stimme nicht Scarlett Johansson selbst, sondern ihre Darstellung im Film Her nachahme. Dazu rechtliche Diskussionen über das Problem, dass die Stimmen von Sprecherinnen und Sprechern von KI-Modellen angeeignet werden. Je nach Johanssons Vertrag könne die rechtliche Lage unterschiedlich sein.
  • Johanssons Entscheidung

    • Die Meinung, dass es interessant sei, dass Johansson auf beträchtliche Tantiemen und Möglichkeiten zur Zusammenarbeit verzichtet habe. Ihr Unbehagen darüber, dass ihre Stimme ohne Zustimmung genutzt werde, sei nachvollziehbar. Das sei vergleichbar damit, dass Entwicklerinnen und Entwickler erleben, wie ihr Code ohne Erlaubnis von KI verwendet wird.
  • Rechtliche Gegenwehr

    • Die Meinung, dass OpenAI zurückgewichen sei, weil Johansson finanziell in der Lage sei, Anwälte zu beauftragen. Es gebe die Sorge, dass Altman und OpenAI die Rechte anderer Menschen leicht verletzen könnten.
  • Der Fall Weird Al Yankovic

    • Die Meinung, dass man sich am Beispiel von Weird Al Yankovic orientieren sollte, der das Prinzip der Zustimmung respektierte und trotzdem bekam, was er wollte.
  • Forderung nach rechtlichen Schritten

    • Die Meinung, dass Johansson das Unternehmen verklagen und ein Exempel statuieren sollte. Sie habe die Ressourcen, um zu kämpfen, und das Unternehmen verdiene es dem Urteil nach.
 
[Dieser Kommentar wurde ausgeblendet.]