Tausende Autoren unterzeichnen einen Brief, in dem sie KI-Hersteller auffordern, mit dem Stehlen von Büchern aufzuhören

Wenn Sie GPT-4 bitten, eine Passage im Stil von Carmen Machado, Margaret Atwood oder Alexander Chee zu machen, wird es dabei gute Arbeit leisten, und das aus gutem Grund: Es hat wahrscheinlich alle ihre Werke im Trainingsprozess und jetzt aufgenommen nutzt ihren Einfallsreichtum für sich. Aber diese und Tausende weitere Autoren sind mit dieser Tatsache nicht zufrieden.

In einem offenen Brief, unterzeichnet von mehr als 8.500 Autoren von Belletristik, Sachbüchern und Poesie werden die Technologieunternehmen hinter großen Sprachmodellen wie ChatGPT, Bard, LLaMa und anderen zur Verantwortung gezogen, weil sie ihre Schriften ohne Erlaubnis oder Vergütung nutzen.

„Diese Technologien ahmen unsere Sprache, Geschichten, unseren Stil und unsere Ideen nach und erwecken sie wieder zum Leben. „Millionen urheberrechtlich geschützter Bücher, Artikel, Essays und Gedichte liefern die ‚Nahrung‘ für KI-Systeme, endlose Mahlzeiten, für die es keine Rechnung gibt“, heißt es in dem Brief.

Obwohl sich ihre Systeme als in der Lage erwiesen, die betreffenden Autoren zu zitieren und zu imitieren, haben sich KI-Entwickler nicht wesentlich mit der Herkunft dieser Werke befasst. Werden sie anhand von Musterexemplaren aus Buchhandlungen und Rezensionen geschult? Haben sie jedes Buch aus der Bibliothek ausgeliehen? Oder haben sie vielleicht einfach eines der vielen illegalen Archive heruntergeladen, wie Libgen?

Eines ist sicher: Sie gingen nicht zu Verlagen und lizenzierten sie – zweifellos die bevorzugte Methode und wohl die einzig legale und ethische. Wie die Autoren schreiben:

Die jüngste Entscheidung des Obersten Gerichtshofs im Fall Warhol v. Goldsmith macht nicht nur deutlich, dass die hohe Kommerzialität Ihrer Nutzung gegen eine faire Nutzung spricht, sondern auch, dass kein Gericht das Kopieren illegal beschaffter Werke als faire Nutzung entschuldigen würde. Durch die Einbettung unserer Schriften in Ihre Systeme droht die generative KI unserem Berufsstand zu schaden, indem sie den Markt mit mittelmäßigen, maschinell verfassten Büchern, Geschichten und Journalismus überschwemmt, die auf unserer Arbeit basieren.

Tatsächlich haben wir dies bereits erlebt. In letzter Zeit wurden eine Reihe von KI-generierten Werken von sehr geringer Qualität veröffentlicht Erklimmen Sie die Jugend-Bestsellerlisten bei Amazon; Verlage werden mit generierten Werken überschwemmt; Und jeden Tag wird genau diese Website (und in Kürze auch dieser Beitrag) nach Inhalten durchsucht, die für SEO in Kumpel umgewandelt werden können.

Diese böswilligen Akteure nutzen die Tools, APIs und Agenten, die von Unternehmen wie OpenAI und Meta entwickelt wurden, die in diesem Zusammenhang selbst als böswillige Akteure bezeichnet werden können. Denn wer sonst würde wissentlich Millionen von Werken stehlen, um ein neues kommerzielles Produkt voranzutreiben? (Na ja, Google natürlich – aber die Suchindizierung unterscheidet sich deutlich von der KI-Aufnahme, und Google Books hatte zumindest die Ausrede, dass es als dedizierter Index gedacht war.)

Da weniger Autoren aufgrund der Komplexität und der engen Spielräume groß angelegter Veröffentlichungen in der Lage sind, ihren Lebensunterhalt mit dem Schreiben zu bestreiten, warnt der offene Brief davor, dass dies eine unhaltbare Situation für sie sei, insbesondere für neuere Autoren, „insbesondere für junge Autoren und Stimmen aus unterrepräsentierten Gemeinschaften“. ”

In dem Schreiben werden die Unternehmen aufgefordert, Folgendes zu tun:

1. Holen Sie die Erlaubnis zur Nutzung unseres urheberrechtlich geschützten Materials in Ihren generativen KI-Programmen ein.

2. Entlohnen Sie Autoren angemessen für die frühere und fortlaufende Nutzung unserer Werke in Ihren generativen KI-Programmen.

3. Entschädigen Sie Autoren angemessen für die Verwendung unserer Werke in KI-Ausgaben, unabhängig davon, ob die Ausgaben gegen geltendes Recht verstoßen oder nicht.

Es besteht keine rechtliche Drohung – wie die Geschäftsführerin von The Author’s Guild (und Unterzeichnerin) Mary Rasenberger erklärt sagte NPR„Klagen kosten enorm viel Geld. Sie dauern wirklich lange.“ Und KI schadet jetzt Autoren.

Welches Unternehmen wird als erstes sagen: „Ja, wir haben unsere KI auf gestohlenen Werken aufgebaut und es tut uns leid, und wir werden dafür bezahlen“? Man kann das nur vermuten, aber es scheint kaum einen Anreiz dafür zu geben. Den meisten Menschen ist nicht bewusst oder beunruhigt, dass LLMs mit illegalen Mitteln erstellt werden und dass sie tatsächlich urheberrechtlich geschützte Werke enthalten und wiedergeben können. Das (sehr ähnliche) Problem ist leichter zu erkennen, wenn es sich um ein generiertes Bild handelt, das den unverwechselbaren Stil eines Künstlers wiedergibt, und da gibt es einige Widerstände.

Aber der subtilere Schaden, der entsteht, wenn man alle Bücher von George Saunders oder Diana Gabaldon als „Nahrung“ für die eigene KI nutzt, regt möglicherweise nicht so viele zum Handeln an – obwohl viele Autoren zum Kampf bereit sind.



tch-1-tech