Erklärung von Scarlett Johansson zur OpenAI-Stimme „Sky“

(twitter.com/BobbyAllyn)

7 Punkte von GN⁺ 2024-05-21 | 9 Kommentare | Auf WhatsApp teilen

Erklärung, die Johanssons PR-Vertreter Marcel Pariseau NPR zur Verfügung gestellt hat. Maschinell ins Koreanische übersetzt

„Im vergangenen September erhielt ich von Sam Altman das Angebot, die Stimme des aktuellen ChatGPT-4.0-Systems zu übernehmen. Er sagte, ich könne dabei helfen, die Kluft zwischen Technologieunternehmen und Kreativen zu überbrücken und dafür zu sorgen, dass sich Verbraucher mit dem tiefgreifenden Wandel in Bezug auf Menschen und KI wohler fühlen. Er sagte auch, meine Stimme könne Menschen Trost spenden.

Nach langem Überlegen habe ich das Angebot aus persönlichen Gründen abgelehnt. Neun Monate später wiesen meine Freunde und meine Familie sowie die Öffentlichkeit darauf hin, wie sehr ein neues System namens „Sky“ meiner Stimme ähnelte.

Als ich die veröffentlichte Demo hörte, war ich schockiert, wütend und konnte kaum glauben, dass Herr Altman eine Stimme verfolgt hatte, die meiner so unheimlich ähnlich war, dass selbst meine engsten Freunde und Nachrichtenmedien den Unterschied kaum erkennen konnten. Herr Altman deutete sogar an, dass die Ähnlichkeit beabsichtigt war, indem er das einzige Wort „her“ twitterte und damit auf den Film „Her“ anspielte, in dem ich Samantha, das Stimmmodell eines Chat-Systems, gesprochen habe, das eine intime Beziehung zu einem Menschen eingeht.

Zwei Tage bevor die ChatGPT-4.0-Demo veröffentlicht wurde, kontaktierte Herr Altman meinen Agenten und bat mich, meine Entscheidung noch einmal zu überdenken. Bevor wir überhaupt miteinander sprechen konnten, war das System bereits veröffentlicht.

Aufgrund ihres Verhaltens blieb mir nichts anderes übrig, als rechtlichen Rat einzuholen, und mein Anwalt sandte Herrn Altman und OpenAI zwei Schreiben mit der Bitte zu erläutern, was sie getan hatten und wie genau die Stimme „Sky“ erstellt worden war. Daraufhin erklärte sich OpenAI schließlich widerwillig bereit, die Stimme „Sky“ zurückzuziehen.

In einer Zeit, in der wir alle mit Deepfakes sowie dem Schutz der eigenen Persönlichkeitsrechte, der eigenen Arbeit und der eigenen Identität ringen, bin ich überzeugt, dass diese Fragen absolute Klarheit erfordern. Ich hoffe auf Lösungen in Form der Verabschiedung geeigneter Gesetze zum Schutz von Transparenz und individuellen Rechten.“

9 Kommentare

xguru 2024-05-26

Laut den Aufzeichnungen hat OpenAI nicht Scarlett Johanssons Stimme kopiert.

botplaysdice 2024-05-22

Wie wird OpenAI wohl darauf reagieren?

Werden sie dann so etwas sagen wie: „Diese Stimme sind nicht Sie. Das hier ist Ihre Stimme.“ und dabei eine wirklich perfekt kopierte Stimme von Scarlett Johansson vorspielen?

Die Abwicklung ist schon etwas enttäuschend. Vielleicht eine Nebenwirkung von zu viel Selbstvertrauen ...

lcanon 2024-05-21

Ich hoffe, das verpasst diesem branchentypischen Spruch „Es ist leichter, um Vergebung zu bitten als um Erlaubnis“ endlich einen ordentlichen Dämpfer. Wenn sie selbst bei einem Hollywood-Star so auftreten, schicken sie bei Protesten von Normalbürgern am Ende vielleicht noch einen Auftragskiller.

shalome7 2024-05-21

Ich persönlich denke, dass die Sky-Stimme bereits vor 6 Monaten veröffentlicht wurde und jeder sie über die iOS-App nutzen konnte, ohne dass sie damals als Scarlett Johansson oder Her ähnlich großes Thema geworden wäre ... (auch auf Reddit, HN usw. meinten Leute, die sie ausprobiert haben, dass man sie nicht so sehr mit derselben Stimme verwechseln würde ..) Auch ich merke jetzt, wenn ich Sky bewusst einstelle, natürlich, dass sie eine Stimme mit dem Flair von Scarlett Johansson in Her hat, aber ich finde nicht, dass es dieselbe Stimme ist.
In so einem Fall frage ich mich, ob es wirklich angemessen ist, dass Scarlett Johansson Rechte an der Stimme geltend macht.

Ein früher hochgeladenes Demo: https://www.youtube.com/watch?v=RcgV2u9Kxh0

Wenn man es mit dem Wissen anhört, dass es um Scarlett Johansson geht, klingt es definitiv ähnlich wie Scarlett Johansson ... haha

eungook 2024-05-22

Ich hoffe, dass Sie inzwischen Ihre Meinung geändert haben.

bbulbum 2024-05-21

Tja … und das von einem Unternehmen, das angeblich die AI-Branche anführt …

xguru 2024-05-21

OpenAI hat dazu separat den Beitrag Wie die Stimmen für ChatGPT ausgewählt wurden veröffentlicht.

Der Auswahlprozess für ChatGPT-Stimmen

Der Sprachmodus von ChatGPT ist eine der Funktionen, die von Nutzern besonders geschätzt werden
Die fünf unverwechselbaren Stimmen (Breeze, Cove, Ember, Juniper, Sky) wurden über einen umfassenden, fünf Monate dauernden Prozess sorgfältig ausgewählt
Professionelle Sprecher, Agenturen, Casting-Direktoren und Branchenberater waren daran beteiligt

Unterstützung der Kreativ-Community und Zusammenarbeit mit der Sprecherbranche

OpenAI unterstützt die Kreativ-Community und arbeitet für das Casting von Stimmen eng mit der Sprecherbranche zusammen
Jeder Sprecher erhält eine Vergütung auf oder über Spitzenniveau des Marktes, solange die Stimme im Produkt verwendet wird
Man vertritt die Überzeugung, dass KI-Stimmen nicht absichtlich die unverwechselbare Stimme von Prominenten nachahmen sollten
Die Stimme von Sky ist keine Nachahmung von Scarlett Johansson, sondern die natürliche Stimme einer anderen professionellen Schauspielerin
Zum Schutz der Privatsphäre der Sprecher werden ihre Namen nicht veröffentlicht

Zusammenarbeit mit preisgekrönten Casting-Direktoren und Produzenten zur Festlegung der Stimmkriterien

Anfang 2023 arbeitete man für die Auswahl der Sprecher mit unabhängigen, renommierten und preisgekrönten Casting-Direktoren und Produzenten zusammen
Die Kriterien für ChatGPT-Stimmen wurden unter sorgfältiger Berücksichtigung der einzigartigen Persönlichkeit jeder Stimme und ihrer Attraktivität für ein globales Publikum festgelegt
Zu den Kriterien gehörten vielfältige Hintergründe oder Mehrsprachigkeit, zeitlose Stimmen, vertrauenswürdige Stimmen sowie warme, ansprechende und selbstbewusste Stimmen

Sprecher und Filmschauspieler mit mehr als 400 Bewerbungen

Im Mai 2023 veröffentlichten die Casting-Agentur und die Casting-Direktoren einen Aufruf zur Talentsuche
Innerhalb einer Woche gingen mehr als 400 Bewerbungen ein
Die Schauspieler absolvierten ihr Vorsprechen, indem sie ein Skript mit ChatGPT-Antworten erhielten und aufnahmen

Auswahl der finalen fünf Stimmen und Diskussion mit den Schauspielern über die Vision der Interaktion mit KI-Stimmen

Während des gesamten Mai 2023 prüfte und wählte das Casting-Team 14 Schauspieler unabhängig aus
Vor der Einreichung der finalen Kandidatenstimmen an OpenAI wurden zusätzliche Verfeinerungen vorgenommen
Mit jedem Schauspieler wurden die Vision der Interaktion mit KI-Stimmen sowie Fähigkeiten, Grenzen, Risiken und Schutzmaßnahmen der Technologie besprochen
Es war wichtig, dass die Schauspieler Umfang und Absicht des Sprachmodus verstanden, bevor sie sich dem Projekt verpflichteten
Nachdem interne Teams von OpenAI die Stimmen aus Produkt- und Forschungsperspektive geprüft hatten, wurden die finalen Stimmen nach sorgfältiger Abwägung ausgewählt

Einladung der Schauspieler nach San Francisco für Aufnahmen und Veröffentlichung der ChatGPT-Stimmen

Im Juni und Juli wurden die Schauspieler für Aufnahmesitzungen und persönliche Treffen mit den Produkt- und Forschungsteams von OpenAI nach San Francisco eingeladen
Am 25. September 2023 wurden die Stimmen in ChatGPT veröffentlicht
Der gesamte Prozess erstreckte sich über fünf Monate und umfasste eine intensive Zusammenarbeit mit den Schauspielern und dem Casting-Team
Für die Audioforschung von GPT-4o und neue Sprachfunktionen arbeitet man weiterhin mit den Schauspielern zusammen

Neuer Sprachmodus von GPT-4o für zahlende Nutzer und Pläne zur Einführung zusätzlicher Stimmen

In den kommenden Wochen soll ChatGPT-Plus-Nutzern eine Alpha-Version des neuen Sprachmodus von GPT-4o bereitgestellt werden
Mit GPT-4o kann man per Sprache deutlich natürlicher mit ChatGPT interagieren
GPT-4o verarbeitet Unterbrechungen nahtlos, verwaltet Gruppengespräche effektiv, filtert Hintergrundgeräusche und passt sich dem Tonfall an
Künftig plant man, zusätzliche Stimmen in ChatGPT einzuführen, um unterschiedlichen Interessen und Vorlieben der Nutzer besser gerecht zu werden

GN⁺ 2024-05-21

Hacker-News-Diskussion

Zusammenfassung ausgewählter Hacker-News-Kommentare

Der Konflikt zwischen OpenAI und Scarlett Johansson
- OpenAI hatte Scarlett Johansson kontaktiert, sie lehnte jedoch ab. Zwei Tage vor dem Start von GPT-4o kontaktierte OpenAI erneut ihre Agentur, erhielt aber keine Antwort. Schließlich demonstrierte OpenAI ein Produkt, das ihre Stimme nachahmte. Nachdem Johanssons Rechtsteam nachfragte, entfernte OpenAI die betreffende Stimme aus dem Produkt.
Das rücksichtslose Verhalten von OpenAI
- Die Meinung, dass es kein gutes Verhalten sei, dass OpenAI mehrfach versucht habe, Johansson zu engagieren, daran gescheitert sei und dann eine ihrer Stimme nachempfundene Version verwendet habe.
Kritik an der ChatGPT-4o-Demo
- Die Meinung, dass Altmans Versuch, „sie“ zu kopieren, unangenehm sei. Dass Johansson sich gegen eine Mitwirkung entschieden habe, werde als gute Entscheidung bewertet. Außerdem werde dadurch klar, dass die TTS-Engine weiterhin verwendet wird.
Mira Muratis Aussage
- Die Meinung, dass Muratis Aussage bemerkenswert sei, wonach der Sprachmodus von GPT-4o eher von natürlichen Aspekten menschlicher Gespräche als vom Film Her inspiriert worden sei. Dass Murati bei der Frage erstarrte, wirke wie ein Versuch, rechtliche Probleme zu vermeiden.
Sams Tweet
- Die Meinung, dass Sams Tweet Scarlett Johanssons Rechtsteam bereits alle nötigen Beweise geliefert habe.
Rechtliche Fragen
- Dass die Sky-Stimme nicht Scarlett Johansson selbst, sondern ihre Darstellung im Film Her nachahme. Dazu rechtliche Diskussionen über das Problem, dass die Stimmen von Sprecherinnen und Sprechern von KI-Modellen angeeignet werden. Je nach Johanssons Vertrag könne die rechtliche Lage unterschiedlich sein.
Johanssons Entscheidung
- Die Meinung, dass es interessant sei, dass Johansson auf beträchtliche Tantiemen und Möglichkeiten zur Zusammenarbeit verzichtet habe. Ihr Unbehagen darüber, dass ihre Stimme ohne Zustimmung genutzt werde, sei nachvollziehbar. Das sei vergleichbar damit, dass Entwicklerinnen und Entwickler erleben, wie ihr Code ohne Erlaubnis von KI verwendet wird.
Rechtliche Gegenwehr
- Die Meinung, dass OpenAI zurückgewichen sei, weil Johansson finanziell in der Lage sei, Anwälte zu beauftragen. Es gebe die Sorge, dass Altman und OpenAI die Rechte anderer Menschen leicht verletzen könnten.
Der Fall Weird Al Yankovic
- Die Meinung, dass man sich am Beispiel von Weird Al Yankovic orientieren sollte, der das Prinzip der Zustimmung respektierte und trotzdem bekam, was er wollte.
Forderung nach rechtlichen Schritten
- Die Meinung, dass Johansson das Unternehmen verklagen und ein Exempel statuieren sollte. Sie habe die Ressourcen, um zu kämpfen, und das Unternehmen verdiene es dem Urteil nach.

2024-05-21

[Dieser Kommentar wurde ausgeblendet.]