Wenn Sie irgendwelchen folgen Autoren in den sozialen MedienVielleicht haben Sie sie kürzlich gegen eine Plattform namens Prosecraft schimpfen sehen, eine Website, von der der Schöpfer Benji Smith behauptete, sie sei „der linguistischen Analyse von Literatur gewidmet, darunter mehr als 25.000 Bücher von Tausenden verschiedener Autoren“. Das bedeutete im Grunde, dass Smith eine Buchdatenbank erstellt hatte, die Ihnen alle möglichen Informationen basierend auf der „Lebendigkeit“ der Sprache und der Gesamtzahl der darin enthaltenen Wörter liefern konnte. Was Das Gemeint war, dass Smith offenbar 25.000 Bücher ohne Wissen oder Zustimmung der Originalautoren in eine Datenbank eingespeist hatte, wodurch der Text katalogisiert, analysiert und in Teile zerlegt werden konnte, wodurch das Werk weniger wie Kunst, sondern eher wie … Vergaser behandelt wurde. (Keine Beleidigung für Vergaser.)
Eine Version von Prosecraft gibt es schon seit Jahren, aber diese Woche kam es zu einer enormen Gegenreaktion gegen die Website, nachdem die Autoren begannen, die atemberaubende Menge an Daten zu bemerken –ihre Daten – die Smith eingegeben hatte, und scheinbar einen Algorithmus darauf trainiert hatte, ihre Arbeit und die Art der von ihnen verwendeten Sprache zu erkennen, sodass er die „lebendigsten“ Passagen heraussuchen und sie mit anderen Büchern vergleichen konnte. Überall kleine Feuer Autor Celeste Ng hat es heute früher durchgemacht und zählte 20 Bücher von Stephen King, 20 Bücher von Jodi Picoult und viele andere Dinge, und der Autor Hari Kunzru bemerkte, dass Prosecraft nicht nur Bücher ohne Erlaubnis mitnahm, sondern auch es als Dienstleistung zu gestaltenund bittet Autoren oder Verleger, sich mit der Aufnahme ihrer Bücher in Verbindung zu setzen (als ob die Website das nicht sowieso schon tun würde).
Aber es dauerte nur einen Tag, an dem er die gesamte literarische Gemeinschaft verärgerte, bis Benji Smith nachgab und Nehmen Sie Prosecraft offlineAber ein Blog-Beitrag, der diese Entscheidung bekannt gibt scheint viel mehr Warnsignale gehisst als gesenkt zu haben. Darin erklärte Smith, dass er Prosecraft ins Leben gerufen habe, um ihm beim Schreiben seiner Memoiren zu helfen, und dass der erste Schritt beim Schreiben eines Buches darin bestehe, zu bestimmen, wie viele Wörter in den meisten Büchern vorkommen. Also fing er an, eine Tabelle zu erstellen, in der er deutlich machte, wie „wertvoll“ es für ihn war, und von da an erweiterte er die Suche nach der Art der Wörter in einem Buch, um die „emotionalen Höhen und Tiefen jeder Geschichte“ und den Zeitpunkt aufzuzeichnen Als ihm die Bücher ausgingen, die er besaß, „benutzte er Webcrawler, um mehr Bücher zu finden“ im Internet.
Smith geht nicht näher darauf ein, aber 25.000 Bücher sind eine ganze Menge Bücher, und die meisten Bücher werden vom Autor oder Verleger nicht vollständig kostenlos ins Internet hochgeladen, aber Smith sagte, dass er dachte, dass er „das ehrt“. „Geist der Fair-Use-Doktrin“, indem er nur „Ausschnitte“ des Textes“ und seiner Statistiken einbezieht. Und da er den Text dieser Bücher mit niemandem teilte, sondern nur sein Prosecraft-System, „glaubte“ er, dass er „die einschlägigen Gesetze einhielt“.
Schließlich sagt Smith in den letzten Absätzen eines Beitrags mit Dutzenden von Absätzen: „Ich höre Ihre Einwände“ gegenüber „der Autorengemeinschaft“ und fügt hinzu: „Ich hoffe, Sie nehmen meine aufrichtige Entschuldigung an.“ Er schließt seinen Beitrag mit der Aussage ab, dass er eines Tages „diese Bibliothek mit Zustimmung von Autoren und Verlegern wieder aufbauen möchte“, was Autoren in den sozialen Medien als Folge davon verstanden haben, dass er seine Buchdatenbank nicht wirklich gelöscht hat, was bedeutet, dass die Daten noch gelöscht werden könnten hypothetisch dazu verwendet werden, KI-Programme darauf zu trainieren, gefälschte Bücher mit der gleichen Anzahl an Wörtern und der gleichen „Lebendigkeit“ wie echte Autoren zu produzieren.
Das mag wie eine Nischensituation erscheinen, die nur eine Gemeinschaft betrifft, aber es wird nur noch schlimmer, bis wir als Gesellschaft Menschen und Unternehmen davon abhalten, der Kunst und Kultur so einen dummen Mist anzutun. Wenn nicht, ist es nur eine Frage der Zeit, bis jeder Film eine reproduzierte Reihe „lebendiger“ Szenen aus anderen Filmen ist, die von einem KI-„Autor“ geschrieben wurden und KI-„Schauspieler“ in den Hauptrollen haben. Jedes Buch ist nur eine Wiederholung der gleichen Handlungspunkte aus ein anderes Buch, und jeder Nachrichtenartikel basiert lediglich auf einer Liste von Wörtern, auf die die Leute gerne klicken.