OpenAI verfolgt laut eigenen Angaben einen „bewussten Ansatz“ bei der Veröffentlichung von Tools, die das Schreiben von ChatGPT erkennen können

OpenAI hat ein Tool entwickelt, das möglicherweise Studenten beim Schummeln erwischen könnte, indem es ChatGPT bittet, ihre Aufgaben zu schreiben – aber laut The Wall Street JournalDas Unternehmen diskutiert, ob es das Spiel tatsächlich veröffentlichen soll.

In einer Stellungnahme gegenüber Tech bestätigte ein Sprecher von OpenAI, dass das Unternehmen an der im Artikel des Journals beschriebenen Methode zur Text-Wasserzeichenherstellung forscht, sagte aber auch, dass man aufgrund der „damit verbundenen Komplexität und der wahrscheinlichen Auswirkungen auf das breitere Ökosystem über OpenAI hinaus“ einen „überlegten Ansatz“ verfolge, bevor man irgendetwas an die Öffentlichkeit weitergebe.

„Die Methode zur Text-Wasserzeichenmarkierung, die wir entwickeln, ist technisch vielversprechend, birgt aber erhebliche Risiken, die wir abwägen, während wir nach Alternativen suchen. Dazu gehören die Anfälligkeit für Umgehungen durch böswillige Akteure und das Potenzial, Gruppen wie Nicht-Englischsprachige unverhältnismäßig stark zu beeinträchtigen“, sagte der Sprecher.

Dies wäre ein anderer Ansatz als die meisten früheren Versuche, KI-generierten Text zu erkennen, die weitgehend wirkungslos waren. Sogar OpenAI selbst hat seinen vorherigen KI-Textdetektor letztes Jahr aufgrund seiner „niedrigen Genauigkeit“ eingestellt.

Mit Textwasserzeichen würde sich OpenAI ausschließlich auf die Erkennung von Texten von ChatGPT konzentrieren, nicht auf die von Modellen anderer Unternehmen. Dies würde durch kleine Änderungen an der Art und Weise geschehen, wie ChatGPT Wörter auswählt, wodurch im Wesentlichen ein unsichtbares Wasserzeichen in der Schrift erstellt wird, das später von einem separaten Tool erkannt werden könnte.

Nach der Veröffentlichung des Artikels im Journal aktualisierte OpenAI auch ein Blogbeitrag vom Mai über seine Forschung zur Erkennung von KI-generierten Inhalten. In dem Update heißt es, dass sich Textwasserzeichen als „sehr genau und sogar wirksam gegen lokale Manipulationen wie Paraphrasen“ erwiesen haben, sich jedoch als „weniger robust gegen globale Manipulationen erwiesen haben; wie die Verwendung von Übersetzungssystemen, die Umformulierung mit einem anderen generativen Modell oder die Aufforderung an das Modell, zwischen jedes Wort ein Sonderzeichen einzufügen und dieses Zeichen dann zu löschen.“

OpenAI schreibt daher, dass diese Methode „von böswilligen Akteuren leicht umgangen werden kann“. Das Update von OpenAI wiederholt auch die Aussage des Sprechers zu Nicht-Englischsprachigen und schreibt, dass Textwasserzeichen „den Einsatz von KI als nützliches Schreibwerkzeug für Nicht-Englisch-Muttersprachler stigmatisieren könnten“.

tch-1-tech