Reddit sperrt seine öffentlichen Daten in neuen Inhaltsrichtlinien und besagt, dass für die Nutzung nun ein Vertrag erforderlich ist

Reddit führt am Donnerstag eine neue Richtlinie ein, die darauf abzielt, seinen Wunsch, seine Inhalte an größere Technologieunternehmen zu lizenzieren, auszugleichen Googleund Schutz der Privatsphäre der Benutzer. Die neu angekündigte „Public Content Policy“ wird nun in die bestehende Datenschutzrichtlinie und Inhaltsrichtlinie von Reddit aufgenommen, um zu steuern, wie kommerzielle Unternehmen und andere Partner auf die Daten von Reddit zugreifen und diese verwenden. In diesem Zusammenhang kündigte das Unternehmen auch einen Subreddit an, der Forschern gewidmet ist, die mit den Daten von Reddit arbeiten.

Die Ankündigung erfolgt kurz nach dem Börsendebüt von Reddit, mit dem sich das Unternehmen positioniert, um den Umsatz nicht nur durch die auf seiner Plattform geschalteten Anzeigen und die API-Nutzung durch Entwickler, sondern auch durch seinen Datenbestand zu steigern. Das Unternehmen gab in seinem IPO-Prospekt an, dass es durch Datenlizenzvereinbarungen bereits 203 Millionen US-Dollar verdient habe und rechnet damit, dass diese Zahl im Laufe der Zeit noch steigen wird.

Obwohl Reddit in der Vergangenheit den Zugriff auf seine Daten nicht für KI-Trainingszwecke blockiert hatte, änderte es im vergangenen Jahr seinen Kurs. Steve Huffman, CEO von Reddit, sagte gegenüber der New York Times, dass es für Reddit keinen Sinn mache, weiterhin „einigen der größten Unternehmen der Welt diesen ganzen Wert kostenlos zur Verfügung zu stellen“, und signalisierte damit den Plan des Unternehmens, in die Datenlizenzierung einzusteigen Raum.

Da diese Bemühungen nun in vollem Gange sind, wird die neue Richtlinie für öffentliche Inhalte den Zugriff auf die Daten von Reddit ohne Vereinbarung weiter sperren.

„Leider sehen wir, dass immer mehr kommerzielle Unternehmen unbefugten Zugriff nutzen oder autorisierten Zugriff missbrauchen, um öffentliche Daten in großen Mengen zu sammeln, einschließlich öffentlicher Reddit-Inhalte.“ Reddit schreibt in seinem Blog. „Schlimmer noch: Diese Unternehmen haben den Eindruck, dass sie bei der Nutzung dieser Daten keinerlei Einschränkungen haben, und sie tun dies ohne Rücksicht auf Benutzerrechte oder Privatsphäre und ignorieren angemessene rechtliche, sicherheitsrelevante und Benutzerentfernungsanfragen. Während wir unsere Bemühungen fortsetzen, bekannte böswillige Akteure zu blockieren, müssen wir mehr tun, um den Zugriff auf öffentliche Reddit-Inhalte in großem Umfang auf vertrauenswürdige Akteure zu beschränken, die sich zur Einhaltung unserer Richtlinien bereit erklärt haben. Aber wir müssen auch weiterhin sicherstellen, dass Benutzer, Mods, Forscher und andere gutgläubige, nichtkommerzielle Akteure Zugang haben.“

Mit anderen Worten: Der Zugriff auf Reddit-Daten für Forschungszwecke und andere nichtkommerzielle Zwecke bleibt bestehen, aber diejenigen Unternehmen, die die Daten von Reddit für andere Zwecke nutzen möchten – einschließlich für KI-Schulungen – müssen zahlen. In einer im Blog veröffentlichten Grafik macht Reddit dies deutlich und sagt, dass Unternehmen, die daran interessiert sind, Reddit-Daten zu nutzen, um „Ihr Produkt für kommerzielle Zwecke zu betreiben, zu erweitern oder zu verbessern“, einen Vertrag benötigen.

Werbetreibende werden unterdessen an eine Anzeigen-API weitergeleitet, um Kampagnen zu verwalten und deren Leistung zu verfolgen.

Da es sich bei dem Unternehmen im Wesentlichen nur um eine große Website handelt, die von Suchmaschinen indiziert werden kann, zielt diese neue Richtlinie darauf ab, Reddit-Inhalte vor unbefugter Sammlung zu schützen und gleichzeitig die Rechte der Benutzer zu respektieren.

Reddit sagt beispielsweise, dass seine Partner die Entscheidungen der Benutzer, ihre Inhalte zu löschen, hochladen müssen. Wenn Benutzer also nicht möchten, dass ihre persönlichen Beiträge zum Futter für zukünftige KI-Engines werden, sollten sie die Möglichkeit haben, sich abzumelden. Partnern wird durch die neue Richtlinie außerdem untersagt, die Inhalte von Reddit zur Identifizierung von Personen oder deren persönlichen Daten zu verwenden, auch für gezielte Werbung. Partner dürfen Reddit-Inhalte auch nicht verwenden, um ihre Benutzer zu spammen oder zu belästigen oder um „Hintergrundüberprüfungen, Gesichtserkennung, staatliche Überwachung durchzuführen oder den Strafverfolgungsbehörden dabei zu helfen, eines der oben genannten Dinge zu tun“.

Die Richtlinie schränkt außerdem den Zugriff auf Medien für Erwachsene ein und stellt klar, dass Reddit die persönlichen Daten seiner Benutzer nicht verkaufen wird. Das Unternehmen weist außerdem darauf hin, dass es niemals nicht öffentliche Inhalte wie private Nachrichten oder nicht öffentliche Kontoinformationen, wie z. B. E-Mails oder Browserverlauf der Benutzer, lizenzieren wird.

Um Forschern zu helfen, die Reddit-Daten für nichtkommerzielle Zwecke nutzen möchten, hat das Unternehmen einen neuen Subreddit eingerichtet: r/reddit4researchers. Das Unternehmen gibt an, mit ihm zusammenzuarbeiten OpenMined außerdem ein Programm zu entwickeln, um die Zusammenarbeit von Forschern mit Reddit anzuleiten und auszubauen.

tch-1-tech