AI Dungeon verwirklichte den Traum, den viele Spieler seit den 80er Jahren hatten: eine sich entwickelnde Handlung, die die Spieler selbst erschaffen und steuern. Jetzt geht es noch weiter mit einer neuen Funktion, die es Spielern ermöglicht, Bilder zu erstellen, die diese Geschichten veranschaulichen.
Entwickelt vom Indie-Game-Studio Latitude, das war anfänglich AI Dungeon ist eine Ein-Personen-Operation und schreibt Dialoge und Szenenbeschreibungen mit einem von mehreren textgenerierenden KI-Modellen, die es den Spielern ermöglichen, auf Ereignisse zu reagieren, wie sie möchten (im Rahmen des Zumutbaren). Es ist noch in Arbeit, aber mit dem Aufkommen von Bilderzeugungssystemen wie Stability AIs Stable Diffusion investiert Latitude in neue Wege, um die Erzählungen der Spieler zu beleben.
Für den Zugriff ist ein Abonnement für einen der Premium-Pläne von Latitude erforderlich, der bei 9,99 $ pro Monat beginnt. Es handelt sich um ein Credit-basiertes System – das Generieren eines Bildes kostet zwei Credits, wobei die Kreditlimits zwischen 480 pro Monat für den günstigsten Plan und 1.650 für den teuersten (29,99 $ pro Monat) liegen. Auf dem AI Dungeon-Client, der über den Steam-Marktplatz von Valve erhältlich ist und einen Preis von 30 US-Dollar hat, erhalten Mitglieder bei ihrem Kauf 500 Credits.
„Mit Stable Diffusion ist die Bilderzeugung schnell genug und kostengünstig genug, um jedem eine benutzerdefinierte Bilderzeugung anzubieten. Die Bildgenerierung macht an sich schon Spaß, und es war ein Kinderspiel, benutzerdefinierte Bilder zu erstellen, die zu Ihrer KI-Dungeon-Geschichte passen“, sagte Josh Terranova, Senior Marketing Director bei Latitude, per E-Mail gegenüber Tech.
Im Gegensatz zu Bilderzeugungssystemen mit vergleichbarer Wiedergabetreue (z. B. OpenAIs DALL-E 2) ist Stable Diffusion in Bezug auf das, was es erstellen kann, uneingeschränkt, mit Ausnahme der Versionen, die über eine API bereitgestellt werden, wie Stability AIs. Anhand von 12 Milliarden Bildern aus dem Internet trainiert, wurde es verwendet, um Kunstwerke, Architekturkonzepte und fotorealistische Porträts zu erstellen – aber auch Pornografie und Deepfakes von Prominenten.
Latitude hofft, sich diese Freiheit zunutze machen zu können, indem es Benutzern erlaubt, „NSFW“-Bilder zu erstellen, einschließlich Aktfotos, solange sie sie nicht veröffentlichen. Der integrierte Story-Sharing-Mechanismus von AI Dungeon ist derzeit für Storys mit Bildern deaktiviert – ein Schritt, der laut Terranova notwendig ist, während Latitude „figur[s] die richtige Erfahrung und Sicherheitsvorkehrungen.“
Das geht ein großes Risiko ein. Latitude landete vor einigen Jahren in heißem Wasser, als einige Benutzer zeigten, dass das Spiel verwendet werden kann, um textbasierte simulierte Kinderpornos zu erstellen. Das Unternehmen implementierte einen Moderationsprozess, bei dem ein menschlicher Moderator neben einem automatisierten Filter Geschichten durchliest, aber der Filter zeigte häufig Fehlalarme an, was zu übereifrigen Sperrungen führte.
Latitude korrigierte schließlich die Mängel des Moderationsprozesses und implementierte eine akzeptable Inhaltsrichtlinie – aber erst nach einigen ernsthaften Überprüfungsbomben und negativer Publicity. Um das gleiche Schicksal zu vermeiden, sagt Terranova, dass Latitude Schritte unternimmt, um KI-generierte Bilder „vernünftig“ zu kuratieren und den Spielern gleichzeitig kreativen Ausdruck zu ermöglichen.
„Wir arbeiten mit Stability AI, den Machern von Stable Diffusion, zusammen, um sicherzustellen, dass Maßnahmen ergriffen werden, um die Generierung bestimmter Arten von Inhalten zu verhindern – hauptsächlich Inhalte, die die sexuelle Ausbeutung von Kindern darstellen. Diese Maßnahmen würden sowohl für veröffentlichte als auch für unveröffentlichte Geschichten gelten“, sagte Terranova. „Es gibt mehrere unbeantwortete Fragen zur Verwendung von KI-Bildern, die wir alle durcharbeiten werden, wenn KI-Bildmodelle zugänglicher werden. Wenn wir mehr darüber erfahren, wie Spieler diese leistungsstarke Technologie nutzen werden, gehen wir davon aus, dass Anpassungen an unserem Produkt und unseren Richtlinien vorgenommen werden könnten.“
In meinen begrenzten Experimenten funktioniert das neue Stable Diffusion-powered Feature – aber nicht konstant gut, zumindest noch nicht. Die vom System generierten Bilder spiegeln tatsächlich die imaginären Szenarien von AI Dungeon wider – zB ein Bild eines Piraten als Antwort auf die Aufforderung „Du triffst auf einen Kapitän“ – aber nicht in einem ähnlichen Kunststil und manchmal mit weggelassenen Details.
Stable Diffusion etwa verwirrte eine besonders detailreiche Szene: „Du versteckst dich im Gebüsch. Du entdeckst eine Gruppe Schläger, die ein Bündel Geld bei sich tragen. Du springst heraus und erstechst einen der Schläger, wodurch er das Bündel fallen lässt.“ Als Reaktion darauf generierte AI Dungeon ein Bild einer Schwertkämpferin in einem Wald vor dem Hintergrund einer Stadt – soweit so gut – aber ohne das „Geldbündel“ in Sichtweite.
Eine weitere komplexe Szene mit Scharmützel-Goblins bereitete Stable Diffusion Probleme. Das System schien sich auf bestimmte Schlüsselwörter auf Kosten des Kontexts zu konzentrieren und erzeugte ein Bild von Kriegern mit Bögen anstelle von Kobolden, die von Schwert und Pfeilen durchbohrt wurden.
Mit AI Dungeon können Sie die Eingabeaufforderung umschalten, um die Ergebnisse zu optimieren, aber meiner Erfahrung nach hat dies keinen großen Unterschied gemacht. Die Bearbeitungen mussten unglaublich spezifisch sein, um eine große Wirkung zu erzielen (z. B. das Hinzufügen einer Zeile wie „im Stil von HR Giger“), und selbst dann war die Wirkung über die Farbpalette hinaus nicht offensichtlich. Meine Hoffnungen auf eine komplett durch Pixelkunst illustrierte Geschichte wurden schnell zunichte gemacht.
Doch selbst wenn die Szenenillustrationen nicht perfekt zum Thema oder realistisch sind – denken Sie an Piraten mit wurstähnlichen Fingern, die mitten in einem Ozean stehen – gibt es etwas an ihnen, das den Handlungssträngen von AI Dungeon mehr Gewicht verleiht. Vielleicht ist es die emotionale Wirkung, Charaktere zu sehen – dein Charaktere – gewissermaßen zum Leben erweckt, in Kämpfe oder Scherze verwickelt oder was auch immer sonst in eine Eingabeaufforderung eindringt. Wissenschaft hat gefunden So viel.
Was ist mit dem – ähm – weniger SFW Seite von Stable Diffusion und AI Dungeon? Nun, das ist schwer zu sagen, weil es im Moment nicht funktioniert. Als dieser Reporter eine ausgesprochen NSFW-Eingabeaufforderung in AI Dungeon testete, gab das System eine Fehlermeldung zurück: „Entschuldigung, aber diese Bildanforderung wurde von Stability.AI (dem Bildmodellanbieter) blockiert. Wir werden die Generierung von 18+ NSFW-Bildern zulassen, sobald die Stabilität es uns ermöglicht, dies selbst zu kontrollieren.“
„[The] Die API hatte immer denselben NSFW-Klassifikator, den die offizielle Open-Source-Version/Codebasis in der Standardinstallation hat“, sagte Emad Mostaque, der CEO von Stability AI, gegenüber Tech, als er zur Klärung kontaktiert wurde. „[It] wird bald auf ein besseres aufgerüstet.“
Terranova sagt, dass Latitude Pläne hat, die Bilderzeugung mit neuen KI-Systemen zu erweitern und möglicherweise diese Art von Beschränkungen auf API-Ebene zu umgehen.
Mit der Zeit denke ich, dass das eine aufregende Zukunft ist – vorausgesetzt, dass sich die Qualität verbessert und anstößige Inhalte nicht zur Norm auf AI Dungeon werden. Es bietet eine Vorschau auf eine ganz neue Kategorie von Spielen, deren Artwork im Handumdrehen erstellt wird und auf Abenteuer zugeschnitten ist, die sich die Spieler selbst ausdenken. Einige Spieleentwickler haben bereits begonnen, damit zu experimentieren, indem sie generative Systeme wie Midjourney verwenden, um Kunst dafür auszuspucken Schützen und Wählen Sie Ihre eigenen Abenteuerspiele.
Aber das sind große Wenns. Wenn die letzten Monate darauf hindeuten, wird sich die Moderation von Inhalten als Herausforderung erweisen – ebenso wie die Lösung der technischen Probleme, die Systeme wie Stable Diffusion weiterhin zum Stolpern bringen.
Eine weitere offene Frage ist, ob die Spieler bereit sein werden, die Kosten für vollständig illustrierte Handlungsstränge zu tragen. Die 10-Dollar-Abonnementstufe enthält ungefähr 250 Illustrationen, was nicht viel ist, wenn man bedenkt, dass sich einige KI-Dungeon-Geschichten über Seiten und Seiten erstrecken können – und wenn man bedenkt, dass schlaue Spieler die ausführen könnten Open Source Version von Stable Diffusion, um Kunstwerke auf ihren eigenen Maschinen zu erstellen.
Latitude will jedenfalls Vollgas geben. Ob das klug war, wird die Zeit zeigen.