Eine neue Studie untersucht, ob KI bei kreativen Aufgaben als automatisierte Hilfe dienen kann. Die Ergebnisse sind gemischt: Sie scheint weniger kreativen Menschen dabei zu helfen, originellere Geschichten zu schreiben – dämpft aber die Kreativität der Gruppe als Ganzes. Dies ist ein Kompromiss, der immer häufiger vorkommen könnte, da KI-Tools kreative Bemühungen beeinträchtigen.
Die Studie stammt von den Forschern Anil Doshi und Oliver Hauser vom University College London bzw. der University of Exeter. veröffentlicht in Science Advances. Und obwohl der Fokus aufgrund der Kurzgeschichten zwangsläufig begrenzt ist, scheint er das von vielen geäußerte Gefühl zu bestätigen: dass KI zwar hilfreich sein kann, aber letztlich bei kreativen Unternehmungen nichts wirklich Neues bietet.
„Unsere Studie stellt einen ersten Blick auf eine sehr große Frage dar, nämlich wie große Sprachmodelle und generative KI im Allgemeinen menschliche Aktivitäten, einschließlich Kreativität, beeinflussen werden“, sagte Hauser in einer E-Mail an Tech. „Obwohl das Potenzial (und zweifellos der Hype) dieser Technologie, große Auswirkungen auf Medien und Kreativität im Allgemeinen zu haben, enorm ist, wird es wichtig sein, dass KI tatsächlich gründlich evaluiert wird – und nicht nur in der Annahme, dass sie positive Ergebnisse bringen wird, breit implementiert wird.“
Im Rahmen des Experiments schrieben Hunderte von Menschen sehr kurze Geschichten (etwa 8 Sätze) zu beliebigen Themen, die jedoch für ein breites Publikum geeignet waren. Eine Gruppe schrieb einfach nur; eine zweite Gruppe erhielt die Möglichkeit, GPT-4 nach einer einzigen Story-Idee mit wenigen Sätzen zu konsultieren (sie konnten so viele oder so wenige verwenden, wie sie wollten); eine dritte Gruppe konnte bis zu fünf solcher Story-Anfänge erhalten.
Nachdem die Geschichten geschrieben waren, wurden sie sowohl von ihren eigenen Autoren als auch von einer zweiten Gruppe bewertet, die nichts über die generative KI-Variante wusste. Diese Leute bewerteten die Geschichten nach Neuartigkeit, Nützlichkeit (also Veröffentlichungswahrscheinlichkeit) und emotionalem Genuss.
Geringe Kreativität, hoher Nutzen … Hohe Kreativität, kein Nutzen
Vor dem Schreiben der Geschichten haben die Teilnehmer auch eine Wortproduktionsaufgabe erledigt, die als Indikator für Kreativität dient. Es ist ein Konzept, das nicht direkt gemessen werden kann, aber in diesem Fall kann man sich der Kreativität beim Schreiben zumindest annähern (ohne Wertung! Nicht jeder ist ein geborener oder geübter Schriftsteller).
„Etwas so Reichhaltiges und Komplexes wie Kreativität mit irgendeinem Maß zu erfassen, scheint mit Komplikationen behaftet zu sein“, schrieb Hauser. „Es gibt jedoch eine umfangreiche Forschungsarbeit zur menschlichen Kreativität und es wird derzeit darüber diskutiert, wie man die Idee der Kreativität am besten in einem Maß erfassen kann.“
Sie sagten, ihr Ansatz werde in der Wissenschaft weithin verwendet und sei in anderen Studien gut dokumentiert.
Die Forscher fanden heraus, dass Personen mit niedrigeren Kreativitätswerten bei der Bewertung ihrer Geschichten am schlechtesten abschnitten, was den Ansatz wohl bestätigt. Sie erzielten auch die größten Erfolge, wenn sie die Möglichkeit bekamen, eine selbst erstellte Story-Idee zu verwenden (was, wie man erwähnen sollte, die überwiegende Mehrheit des Experiments tat).
Geschichten von Leuten mit einem niedrigen Kreativitätswert, die gerade geschrieben haben, wurden in Bezug auf Schreibqualität, Unterhaltungswert und Neuartigkeit zuverlässig schlechter bewertet als andere. Bei einer von der KI generierten Idee erzielten sie in jeder Hinsicht höhere Werte. Bei der Auswahl von fünf Ideen erzielten sie sogar noch höhere Werte.
Es scheint wirklich so, dass der KI-Helfer die Qualität der Arbeit von Leuten verbessert, die mit der kreativen Seite des Schreibens zu kämpfen haben (zumindest in diesem Kontext und dieser Definition). Das kommt wahrscheinlich bei vielen an, denen das Schreiben nicht leicht fällt und für die ein Sprachmodell, das sagt „Hey, probier das mal“ der Anstoß ist, den sie brauchen, um einen Absatz zu beenden oder ein neues Kapitel zu beginnen.
Aber was ist mit den Leuten, die beim Kreativitätsmaßstab hoch abschnitten? Haben ihre Schreibfähigkeiten neue Höhen erreicht? Leider nein. Tatsächlich sahen diese Teilnehmer wenig bis gar keinen Vorteil oder erhielten sogar (obwohl es sehr knapp und wohl nicht signifikant ist) schlechtere Bewertungen. Es scheint, dass diejenigen auf der kreativen Seite ihre besten Arbeiten produzierten, wenn sie überhaupt keine KI-Hilfe hatten.
Man kann sich viele Gründe dafür vorstellen, doch die Zahlen deuten darauf hin, dass die KI in dieser Situation keinen oder sogar keinen negativen Einfluss auf Autoren mit angeborener Kreativität hatte.
Abgeflacht
Aber das war nicht der Teil, der den Forschern Sorgen bereitete.
Über die subjektive Bewertung der Geschichten durch die Teilnehmer hinaus führten die Forscher einige eigene Analysen durch. Sie nutzten OpenAIs Embeddings API, um zu bewerten, wie ähnlich jede Geschichte den anderen Geschichten in ihrer Kategorie war (d. h. nur von Menschen, eine KI-Option oder fünf KI-Optionen).
Sie fanden heraus, dass der Zugriff auf generative KI dazu führte, dass die resultierenden Geschichten näher am Durchschnitt ihrer Kategorie lagen. Mit anderen Worten, sie waren als Gruppe ähnlicher und weniger unterschiedlich. Der Gesamtunterschied lag im Bereich von 9-10 %, es war also nicht so, als wären die Geschichten alle Klone voneinander. Und wer weiß, vielleicht ist diese Ähnlichkeit ein Artefakt davon, dass weniger geübte Autoren eine vorgeschlagene Geschichte zu Ende schreiben, während kreativere Autoren sich eine von Grund auf ausdenken.
Dennoch war dieser Befund ausreichend, um in den Schlussfolgerungen einen warnenden Hinweis zu geben. Ich konnte ihn hier nicht zusammenfassen und zitiere ihn daher vollständig:
Während diese Ergebnisse auf eine Zunahme der individuellen Kreativität hinweisen, besteht die Gefahr, dass der kollektive Neuheitswert verloren geht. Im allgemeinen Gleichgewicht ist eine interessante Frage, ob die durch KI verbesserten und inspirierten Geschichten in der Lage sein werden, ausreichend Abwechslung in den Ergebnissen zu erzeugen, zu denen sie führen. Insbesondere wenn die Verlagsbranche (und die Selbstverlagsbranche) mehr von generativer KI inspirierte Geschichten annehmen würde, deuten unsere Ergebnisse darauf hin, dass die produzierten Geschichten insgesamt weniger einzigartig und einander ähnlicher würden. Diese Abwärtsspirale weist Parallelen zu einem sich abzeichnenden sozialen Dilemma auf: Wenn einzelne Autoren herausfinden, dass ihr von generativer KI inspiriertes Schreiben als kreativer bewertet wird, haben sie einen Anreiz, generative KI in Zukunft stärker zu nutzen, aber dadurch könnte der kollektive Neuheitswert der Geschichten weiter abnehmen. Kurz gesagt, unsere Ergebnisse deuten darauf hin, dass trotz des Verbesserungseffekts, den generative KI auf die individuelle Kreativität hatte, ein Warnhinweis angebracht sein könnte, wenn generative KI für kreative Aufgaben breiter eingesetzt würde.
Es spiegelt die Angst in der bildenden Kunst und im Web wider, dass, wenn die KI zu mehr KI führt und das, womit sie trainiert wird, nur mehr von sich selbst ist, sie in einem sich selbst verstärkenden Kreislauf der Eintönigkeit enden könnte. Während generative KI in jedes Medium einzudringen beginnt, sind es Studien wie diese, die als Gegengewicht zu Behauptungen grenzenloser Kreativität oder neuer Äras KI-generierter Filme und Lieder dienen.
Hauser und Doshi sind sich darüber im Klaren, dass ihre Arbeit nur der Anfang ist – das Forschungsgebiet ist brandneu und jede Studie, auch ihre eigene, ist begrenzt.
„Wir erwarten, dass zukünftige Forschungen eine Reihe von Ansätzen aufgreifen werden. So wird die Implementierung generativer KI in freier Wildbahn ganz anders aussehen als in unserer kontrollierten Umgebung“, schrieb Hauser. „Im Idealfall hilft unsere Studie dabei, sowohl die Technologie als auch die Art und Weise, wie wir mit ihr interagieren, zu steuern, um eine anhaltende Vielfalt kreativer Ideen zu gewährleisten, sei es in der Literatur, der Kunst oder der Musik.“