Am Montagmorgen wachten zahlreiche Autoren auf und erfuhren, dass ihre Bücher ohne ihre Zustimmung hochgeladen und in einen riesigen Datensatz gescannt worden waren. Ein Projekt des Cloud-Textverarbeitungsprogramms Shaxpir, Prosakunst hat über 27.000 Bücher zusammengestellt und sie anhand der „Lebendigkeit“ ihrer Sprache verglichen, bewertet und analysiert. Viele Autoren – darunter auch Young Adult Powerhouse Maureen Johnson und Autor von „Little Fires Everywhere“. Celeste Ng – sprach sich gegen Prosecraft aus, weil es ohne Zustimmung ein Modell in ihren Büchern trainierte. Sogar Bücher, die vor weniger als einem Monat veröffentlicht wurden, waren bereits hochgeladen.
Nach einem Tag voller gerechtfertigter Online-Gegenreaktionen hat Prosecraft-Erfinder Benji Smith die seit 2017 bestehende Website geschlossen.
„Ich habe Tausende von Stunden damit verbracht, an diesem Projekt zu arbeiten, Texte zu bereinigen und zu kommentieren, Dinge zu organisieren und zu optimieren“, sagt Smith schrieb. „Aber inzwischen ist ‚KI‘ ein Ding geworden. Und die Ankunft der KI in der Szene wurde durch frühe Anwendungsfälle beeinträchtigt, die es jedem ermöglichten, mühelos Nachahmungen von Künstlern zu erstellen und diese Schöpfer aus ihrem eigenen kreativen Prozess auszuschließen.“
Smiths Prosecraft war kein generatives KI-Tool, aber die Autoren befürchteten, dass es eines werden könnte, da er einen Datensatz von einer Viertelmilliarde Wörtern aus veröffentlichten Büchern zusammengetragen hatte, die er beim Durchsuchen des Internets gefunden hatte.
Prosacraft zeigte zwei Absätze aus einem Buch, einen „am passivsten“ und einen „am lebhaftesten“. Anschließend ordnete es die Bücher in eine Perzentil-Rangliste ein, basierend darauf, wie lebhaft, wie lang oder wie passiv sie waren.
„Wenn man beruflich Schriftsteller ist, ist das wahnsinnig, zum Teil, weil Stil nicht dasselbe ist wie das Schreiben eines verdammten Whitepapers für ein Unternehmen, das dabei sein muss Aktive Stimme oder was auch immer“, sagte Masad. „Stil ist Stil!“
Smith reagierte nicht auf mehrere Anfragen nach Kommentaren, erläuterte jedoch in seinem Kommentar seine Absichten Blogeintrag.
„Da ich nur zusammenfassende Statistiken und kleine Ausschnitte aus dem Text dieser Bücher veröffentlichte, glaubte ich, den Geist der Fair-Use-Doktrin zu respektieren, die nicht die Zustimmung des ursprünglichen Autors erfordert“, schrieb Smith. Einige Autoren stellten fest, dass die Auszüge ihrer Bücher über Prosacraft große Spoiler enthielten, was zu weiterer Frustration führte.
Obwohl sich Smith entschuldigte, sind die Autoren weiterhin verärgert. Für Künstler und Schriftsteller hat die jüngste Verbreitung von KI-Tools zu einem zutiefst frustrierenden Schlagabtausch geführt. Sobald sie sich von einer Datenbank abmelden, stellen sie fest, dass ihre Arbeit zum Trainieren eines anderen KI-Modells verwendet wurde und so weiter.
„Soweit ich das beurteilen kann, ist es so ziemlich die Norm, dass diese Websites und Projekte zuerst tun, was sie tun, und dann hoffen, dass es niemand bemerkt, und dann verschwinden oder in die Defensive gehen, wenn sie es unweigerlich tun“, sagte Masad.
Generative KI und die Technologie hinter Self-Publishing haben einen perfekten Sturm für betrügerische Aktivitäten geschaffen. Amazon wurde mit minderwertigen, KI-generierte Reiseführerund sogar KI-generiert Kinderbuch. Aber Tools wie ChatGPT sind grundsätzlich auf die Gesamtheit des Internets ausgelegt, was bedeutet, dass echte Reiseschriftsteller oder Kinderbuchautoren versehentlich plagiiert werden könnten.
Die Autorin Jane Friedman schrieb in einem aktueller Blogbeitrag – mit dem Titel „Ich würde lieber sehen, dass meine Bücher raubkopiert werden als das“ –, dass sie auf Amazon imitiert wird, wo jemand unter ihrem Namen Bücher verkauft, die scheinbar mit einer KI geschrieben wurden.
Obwohl es Friedman gelungen ist, diese gefälschten Bücher von ihrer Goodreads-Seite zu entfernen, sagt sie, dass Amazon die zum Verkauf stehenden Bücher nicht entfernen wird, es sei denn, sie hat eine Marke für ihren Namen.
Amazon hat vor der Veröffentlichung keinen Kommentar abgegeben.
„Ich glaube nicht, dass irgendein Autor ernsthaft davon überzeugt ist, dass KI Bücher ruinieren wird, denn so funktioniert Literatur nicht, und alles, was ich ChatGPT als ‚Geschichte‘ schreiben sah, ist ohne Stimme einfach verdammt langweilig.“ oder echtes Handwerk oder Stil“, sagte Masad.
Sie befürchtet jedoch, dass Verlage vom Gegenteil überzeugt werden und möglicherweise Marketing- und Werbeteams durch KI-generierte Werbeinhalte ersetzen.
„Es fühlt sich wirklich schlimm an“, sagte sie.