OpenAI entfernt eine der von ChatGPT verwendeten Stimmen. Benutzer fanden, dass es ähnlich klang wie das Unternehmen Scarlett Johansson angekündigt Am Montag veröffentlichte Johansson selbst eine Erklärung, in der sie sagte, sie habe einen Rechtsbeistand beauftragt, sich nach der Sky-Stimme zu erkundigen und genaue Einzelheiten über deren Entwicklung zu erfahren. Sky wird jetzt pausiert, nachdem OpenAI es letzte Woche bei der Demo seines neuen GPT-4o-Modells verwendet hat.
„Wir glauben, dass KI-Stimmen nicht absichtlich die unverwechselbare Stimme einer Berühmtheit nachahmen sollten – Skys Stimme ist keine Nachahmung von Scarlett Johansson, sondern gehört einer anderen professionellen Schauspielerin, die ihre eigene natürliche Sprechstimme verwendet“, schrieb das Unternehmen in einem Blogeintrag. „Um ihre Privatsphäre zu schützen, können wir die Namen unserer Sprecher nicht weitergeben.“
Ein Video der Demo machte letzte Woche in den sozialen Medien die Runde, da Benutzer fanden, dass die Stimme der von Johansson ähnelte. Einige machten sich über die Stimme lustig, weil sie existierte übermäßig kokettwährend andere es mit einem verglichen männliche Fantasie.
Die kokette Stimme hat Vergleiche mit dem Film „Her“ aus dem Jahr 2013 gezogen, in dem Johansson einer sinnlichen virtuellen Assistentin die Stimme gibt. Die Hauptfigur des Films, gespielt von Joaquin Phoenix, verliebt sich schließlich in den virtuellen Assistenten.
Obwohl das Unternehmen die Stimme von Sky nicht mit der von Johansson verglichen hat, sagte OpenAI-CEO Sam Altman getwittert das Wort „Her“ im Anschluss an das Firmenereignis.
Tech bestätigte, dass Johansson später am Montag eine Erklärung veröffentlichte, in der es hieß, dass OpenAI sie im September wegen der Bereitstellung der Stimme kontaktiert habe, worüber zuerst NPR-Korrespondent Bobby Allyn berichtete. In der Erklärung sagte sie, dass sie „nach reiflicher Überlegung und aus persönlichen Gründen“ abgelehnt habe und „schockiert“ gewesen sei, als sie die veröffentlichte Demo gehört habe.
In der Erklärung heißt es auch, dass sie „gezwungen war, einen Rechtsbeistand zu beauftragen“ und dass das Unternehmen „widerwillig zugestimmt“ hatte, die Sky-Stimme zu ändern.
Die Demo von OpenAI letzte Woche zielte darauf ab, die verbesserten Konversationsfähigkeiten des Chatbots zu demonstrieren, ging aber viral, nachdem die sinnliche Stimme über fast alles kicherte, was ein OpenAI-Mitarbeiter sagte. Irgendwann sagte der Chatbot zu dem Mitarbeiter: „Wow, das ist ja ein tolles Outfit, das du anhast.“ An einer anderen Stelle sagte der Chatbot „Hör auf, du bringst mich zum Erröten“, nachdem er ein Kompliment erhalten hatte.
In seinem Blogbeitrag sagt OpenAI, dass die Stimmen seiner Chatbots „nahbar“ klingen und „Vertrauen erwecken“ sollen. Außerdem sollen sie eine „warme, einnehmende, vertrauenerweckende, charismatische Stimme“ haben.
OpenAI plant, künftig „zusätzliche Stimmen in ChatGPT einzuführen, um den vielfältigen Interessen und Vorlieben der Benutzer besser gerecht zu werden“.
Johanssons vollständige Aussage:
„Letzten September erhielt ich ein Angebot von Sam Altman, der mich als Sprecher für das aktuelle ChatGPT 4.0-System engagieren wollte. Er erzählte mir, dass er das Gefühl habe, dass ich durch die Äußerung des Systems die Kluft zwischen Technologieunternehmen und Kreativen überbrücken und den Verbrauchern helfen könne, sich mit dem seismischen Wandel in Bezug auf Menschen und KI wohl zu fühlen. Er sagte, er habe das Gefühl, dass meine Stimme die Menschen trösten würde.
Nach langem Überlegen und aus persönlichen Gründen lehnte ich das Angebot ab. Neun Monate später bemerkten meine Freunde, meine Familie und die breite Öffentlichkeit, wie sehr das neueste System namens „Sky“ nach mir klang.
Als ich die veröffentlichte Demo hörte, war ich schockiert, verärgert und ungläubig, dass Mr. Altman eine Stimme verfolgen würde, die meiner so unheimlich ähnlich klang, dass meine engsten Freunde und Nachrichtenagenturen den Unterschied nicht erkennen konnten. Herr Altman deutete sogar an, dass die Ähnlichkeit beabsichtigt war, indem er ein einziges Wort „sie“ twitterte – eine Anspielung auf den Film, in dem ich einem Chatsystem die Stimme gab, Samantha, die eine innige Beziehung mit einem Menschen aufbaut.
Zwei Tage vor der Veröffentlichung der ChatGPT 4.0-Demo kontaktierte Herr Altman meinen Agenten und bat mich, es mir noch einmal zu überlegen. Bevor wir uns verbinden konnten, war das System draußen.
Aufgrund ihrer Handlungen war ich gezwungen, einen Rechtsbeistand einzuschalten, der zwei Briefe an Herrn Altman und OpenAI schrieb, in denen er darlegte, was sie getan hatten, und sie aufforderte, den genauen Prozess zu beschreiben, durch den sie die „Sky“-Stimme geschaffen hatten. Infolgedessen stimmte OpenAI widerstrebend zu, die „Sky“-Stimme zu entfernen.
In einer Zeit, in der wir uns alle mit Deepfakes und dem Schutz unseres eigenen Abbilds, unserer eigenen Arbeit, unserer eigenen Identität auseinandersetzen, sind dies meiner Meinung nach Fragen, die absolute Klarheit verdienen. Ich freue mich auf eine Lösung in Form von Transparenz und der Verabschiedung geeigneter Gesetze, um sicherzustellen, dass die Rechte des Einzelnen geschützt werden.“
OpenAI teilte die folgende Aussage von Altman mit: „Die Stimme von Sky ist nicht die von Scarlett Johansson und es war nie beabsichtigt, ihrer zu ähneln. Wir haben den Synchronsprecher hinter Skys Stimme ausgewählt, bevor wir uns an Frau Johansson wenden. Aus Respekt vor Frau Johansson haben wir die Verwendung der Stimme von Sky in unseren Produkten eingestellt. Es tut uns leid, Frau Johansson, dass wir nicht besser kommuniziert haben.“
Update: Diese Geschichte wurde ursprünglich am Montag um 8 Uhr PT veröffentlicht und wurde aktualisiert, um die Aussagen von Johansson und Altman aufzunehmen.