Bluesky -Benutzer diskutieren Pläne über Benutzerdaten und KI -Schulungen

Social Network Bluesky in letzter Zeit veröffentlichte einen Vorschlag zu Github Neue Optionen skizzieren, um den Nutzern anzugeben, ob ihre Beiträge und Daten für Dinge wie generatives KI -Training und öffentliche Archivierung abgekratzt werden sollen.

CEO Jay Graber diskutierte den Vorschlag Anfang dieser Woche, während er auf der Bühne in South bei Southwest, aber er erregte am Freitagabend neue Aufmerksamkeit, nachdem sie sie Gepostet darüber auf Bluesky. Einige Benutzer reagierten mit Alarm auf die Pläne des Unternehmens, die sie als Umkehrung von Blueskys früheren Beharrlichkeit, dass sie keine Benutzerdaten an Werbetreibende verkaufen und KI auf Benutzerbeiträgen nicht ausbilden, angesehen haben.

„Oh, verdammt nein!“ die Benutzer -Skizzeette schrieb. „Das Schöne an dieser Plattform war das Nicht -Teilen von Informationen. Besonders Gen Ai. Höhle du jetzt nicht. “

Graber antwortete dass generative KI -Unternehmen „bereits öffentliche Daten aus dem gesamten Web abkratzen“, auch von Bluesky, da „alles auf Bluesky wie eine Website öffentlich ist“. Also sagte sie, Bluesky versuche, einen „neuen Standard“ zu erstellen, um das Kratzen zu regieren, ähnlich wie die Robots.txt Datei, auf denen Websites ihre Berechtigungen an Webcrawler weitergeben.

Debatten über KI -Training und Urheberrecht haben Robots.txt ins Rampenlicht gezogen, was unter anderem die Tatsache hervorhebt, dass es nicht gesetzlich durchsetzbar ist. Bluesky sucht seinen vorgeschlagenen Standard als einen ähnlichen „Mechanismus und Erwartungen“ und liefert „ein maschinenlesbares Format, von dem gute Akteure einhalten und das ethische Gewicht tragen, aber nicht rechtlich durchsetzbar sind“.

Unter dem Vorschlag, Benutzer der Bluesky -App oder andere Apps, die die zugrunde liegenden verwenden Atprotocolkönnte in ihre Einstellungen eingehen und die Verwendung ihrer Bluesky -Daten in vier Kategorien zulassen oder nicht verhindern: Generative KI, Protokollbrückung (dh die Verbindung verschiedener sozialer Ökosysteme), Bulk -Datensätze und Webarchivierung (wie die Wayback -Maschine des Internetarchivs).

Wenn ein Benutzer angab, dass er nicht wollte, dass seine Daten zur Ausbildung generativer KI verwendet werden, heißt es in dem Vorschlag: „Unternehmen und Forschungsteams, die KI -Schulungssätze aufbauen, werden diese Absicht bei der Sichtweise entweder beim Kratzen von Websites oder beim Durchführen von Massenübertragungen mit dem Protokoll selbst erwarten.“

Molly White, der das Zitat schreibt, benötigt Newsletter und Web3, wird einfach ein großartiger Blog. beschrieben dies Als „ein guter Vorschlag“ und sagte, es sei „seltsam zu sehen, dass die Leute Bluesky dafür flammen“, da es nicht so sehr „in der KI -Kratzung einladend“ ist, sondern „versucht, ein Einverständnissignal hinzuzufügen, damit Benutzer Einstellungen für das bereits geschehene Schicksal vermitteln können“.

„Ich denke die Schwäche damit und [Creative Commons’] Ein ähnlicher Vorschlag für „Präferenzsignale“ ist, dass sie sich auf Schaber verlassen, um diese Signale aus einem Wunsch, gute Schauspieler zu sein „, fuhr White fort. „Wir haben bereits einige dieser Unternehmen gesehen, die Robots.txt oder Piratenmaterial zum Kratzen angewachsen sind.“

tch-1-tech