Die New York Times möchte, dass OpenAI und Microsoft für Trainingsdaten bezahlen

Die New York Times verklagt OpenAI und seinen engen Mitarbeiter (und Investor) Microsoft wegen angeblicher Verletzung des Urheberrechts durch das Training generativer KI-Modelle auf den Inhalten der Times.

Im Klage, eingereicht beim Bundesbezirksgericht in Manhattan, behauptet The Times, dass Millionen ihrer Artikel ohne ihre Zustimmung zum Trainieren von KI-Modellen verwendet wurden, einschließlich derer, die dem äußerst beliebten ChatGPT von OpenAI und Copilot von Microsoft zugrunde liegen. Die Times fordert OpenAI und Microsoft auf, Modelle und Trainingsdaten, die das beleidigende Material enthalten, zu „zerstören“ und für „gesetzliche und tatsächliche Schäden in Milliardenhöhe“ im Zusammenhang mit dem „rechtswidrigen Kopieren und Verwenden der einzigartig wertvollen Werke der Times“ verantwortlich zu machen .“

„Wenn die Times und andere Nachrichtenorganisationen ihren unabhängigen Journalismus nicht produzieren und schützen können, entsteht ein Vakuum, das weder Computer noch künstliche Intelligenz füllen können“, heißt es in der Beschwerde der Times. „Es wird weniger Journalismus produziert und die Kosten für die Gesellschaft werden enorm sein.“

Generative KI-Modelle „lernen“ aus Beispielen, um Aufsätze, Code, E-Mails, Artikel und mehr zu erstellen, und Anbieter wie OpenAI durchsuchen das Internet nach Millionen bis Milliarden dieser Beispiele, um sie zu ihren Trainingssätzen hinzuzufügen. Einige Beispiele sind gemeinfrei. Bei anderen ist dies nicht der Fall oder sie unterliegen restriktiven Lizenzen, die eine Quellenangabe oder bestimmte Formen der Entschädigung erfordern.

Anbieter argumentieren, dass die Fair-Use-Doktrin einen umfassenden Schutz für ihre Web-Scraping-Praktiken bietet. Urheberrechtsinhaber sind anderer Meinung; Hunderte der Nachrichtenorganisationen verwenden mittlerweile Code, um zu verhindern, dass OpenAI, Google und andere ihre Websites nach Trainingsdaten durchsuchen.

Der Konflikt zwischen Anbietern und Filialen hat zu einer wachsenden Zahl von Rechtsstreitigkeiten geführt, zuletzt gegen The Times.

Die Schauspielerin Sarah Silverman schloss sich im Juli zwei Klagen an, in denen Meta und OpenAI beschuldigt wurden, Silvermans Memoiren „verschluckt“ zu haben, um ihre KI-Modelle zu trainieren. In einer separaten Klage behaupten Tausende von Romanautoren, darunter Jonathan Franzen und John Grisham, dass OpenAI ihre Arbeit ohne ihre Erlaubnis oder ihr Wissen als Trainingsdaten bezogen habe. Und mehrere Programmierer haben ein laufendes Verfahren gegen Microsoft, OpenAI und GitHub wegen Copilot, einem KI-gestützten Code-Generierungstool, das nach Angaben der Kläger unter Verwendung ihres IP-geschützten Codes entwickelt wurde.

Während The Times nicht der erste ist, der Anbieter generativer KI wegen angeblicher IP-Verletzungen im Zusammenhang mit schriftlichen Werken verklagt, ist es der bisher größte Verlag, der an einer solchen Klage beteiligt ist – und einer der ersten, der auf potenzielle Schäden für seine Marke durch „Halluzinationen“ hingewiesen hat. oder erfundene Fakten aus generativen KI-Modellen.

In der Beschwerde der Times werden mehrere Fälle angeführt, in denen Microsofts Bing Chat (jetzt Copilot genannt), der auf einem OpenAI-Modell basiert, falsche Informationen lieferte, die angeblich von The Times stammten – darunter Ergebnisse für „die 15 herzgesündesten Lebensmittel“. “, 12 davon wurden in keinem Times-Artikel erwähnt.

Die Times macht außerdem geltend, dass OpenAI und Microsoft mit den Werken der Times tatsächlich Konkurrenten für Nachrichtenverleger aufbauen und dem Geschäft der Times schaden, indem sie Informationen bereitstellen, auf die normalerweise ohne ein Abonnement nicht zugegriffen werden könnte – Informationen, die nicht immer zitiert werden , manchmal monetarisiert und ohne Affiliate-Links, die The Times außerdem zur Generierung von Provisionen verwendet.

Wie die Beschwerde der Times andeutet, neigen generative KI-Modelle dazu, Trainingsdaten wiederzugeben, indem sie beispielsweise nahezu wörtliche Ergebnisse aus Artikeln reproduzieren. Über das Aufstoßen hinaus hat OpenAI dies mindestens einmal getan versehentlich ermöglichte ChatGPT-Benutzern, kostenpflichtige Nachrichteninhalte zu umgehen.

„Die Beklagten versuchen, die massiven Investitionen der Times in ihren Journalismus auszunutzen“, heißt es in der Klage und werfen OpenAI und Microsoft vor, „die Inhalte der Times ohne Bezahlung zu nutzen, um Produkte zu entwickeln, die die Times ersetzen und ihr das Publikum wegnehmen.“

Die Auswirkungen auf das Nachrichtenabonnementgeschäft – und den Webverkehr der Verlage – stehen im Mittelpunkt einer ansatzweise ähnlichen Klage, die Verlage Anfang des Monats gegen Google eingereicht hatten. In dem Fall argumentierten die Beklagten wie The Times, dass die GenAI-Experimente von Google, darunter der KI-gestützte Bard-Chatbot und Search Generative Experience, mit wettbewerbswidrigen Mitteln Inhalte, Leser und Werbeeinnahmen von Verlagen abschöpfen.

Die Behauptungen der Verlage sind glaubwürdig. Ein aktuelles Modell von The Atlantic gefunden Wenn eine Suchmaschine wie Google KI in die Suche integrieren würde, würde sie die Anfrage eines Benutzers in 75 % der Fälle beantworten, ohne dass ein Klick auf die Website erforderlich wäre. Die von der Google-Klage betroffenen Publisher schätzen, dass sie bis zu 40 % ihres Traffics verlieren würden.

Einige Nachrichtenagenturen haben sich dafür entschieden, Lizenzvereinbarungen mit ihnen abzuschließen, anstatt sich vor Gericht gegen die Anbieter zu wehren. Die Associated Press geschlagen im Juli einen Deal mit OpenAI abgeschlossen, und Axel Springer, der deutsche Verlag, dem Politico und Business Insider gehören, hat diesen Monat dasselbe getan.

In ihrer Beschwerde gibt The Times an, dass man im April versucht habe, eine Lizenzvereinbarung mit Microsoft und OpenAI zu treffen, dass die Gespräche aber letztendlich nicht fruchtbar gewesen seien.

tch-1-tech