Twitter enthüllt einen Teil seines Quellcodes, einschließlich seines Empfehlungsalgorithmus

Twitter sagt dass die Basisstufe seiner API 100 pro

Wie wiederholt von Twitter-CEO Elon Musk versprochen, hat Twitter es getan geöffnet einen Teil seines Quellcodes zur öffentlichen Einsicht, einschließlich des Algorithmus, den es verwendet, um Tweets in den Timelines der Benutzer zu empfehlen.

Auf GitHub veröffentlichte Twitter zwei Lagerstätten enthält Code für viele Teile, die das soziale Netzwerk zum Ticken bringen, einschließlich des Mechanismus, den Twitter verwendet, um die Tweets zu steuern, die Benutzer auf der For You-Timeline sehen. In einem Blogbeitrag bezeichnete Twitter den Schritt als „ersten Schritt in die Zukunft[ing] transparenter“ und gleichzeitig „[preventing] risk“ für Twitter selbst und Personen auf der Plattform.

Zu diesem zweiten Punkt enthalten die Open-Source-Veröffentlichungen weder den Code, der die Anzeigenempfehlungen von Twitter unterstützt, noch die Daten, die zum Trainieren des Empfehlungsalgorithmus von Twitter verwendet werden. Darüber hinaus enthalten sie einige Anweisungen zur Überprüfung oder tatsächlichen Verwendung des Codes, was die Idee verstärkt, dass die Veröffentlichungen streng auf Entwickler ausgerichtet sind.

„[We excluded] Jeder Code, der die Sicherheit und Privatsphäre der Benutzer oder die Fähigkeit, unsere Plattform vor schlechten Akteuren zu schützen, beeinträchtigen würde, einschließlich der Untergrabung unserer Bemühungen zur Bekämpfung der sexuellen Ausbeutung und Manipulation von Kindern“, schrieb Twitter. „Wir [also took] Schritte, um sicherzustellen, dass die Sicherheit und Privatsphäre der Benutzer geschützt sind.“

Twitter sagt, dass es an Tools arbeitet, um Codevorschläge aus der Community zu verwalten und Änderungen mit seinem internen Repository zu synchronisieren. Vermutlich werden diese zu einem späteren Zeitpunkt verfügbar sein – derzeit gibt es keine Anzeichen dafür.

Auf den ersten Blick ist der Algorithmus ziemlich komplex – aber aus technischer Sicht nicht unbedingt überraschend. Es besteht aus mehreren Modellen, einschließlich eines Modells zur Erkennung von „nicht sicher für den Arbeitsplatz“ oder missbräuchlichen Inhalten, der Wahrscheinlichkeit, dass ein Twitter-Benutzer mit einem anderen Benutzer interagiert, und der Berechnung des „Rufs“ eines Twitter-Benutzers. (Es ist unklar, worauf sich „Reputation“ genau bezieht; die High-Level-Dokumentation ist nicht klar.) Mehrere neuronale Netzwerke sind für die Rangfolge der Tweets und die Empfehlung von Accounts verantwortlich, denen gefolgt werden soll, während eine Filterkomponente Tweets verbirgt, um – verzeihen Sie den Jargon – „Unterstützen Sie die Einhaltung gesetzlicher Vorschriften, verbessern Sie die Produktqualität, erhöhen Sie das Vertrauen der Benutzer, schützen Sie den Umsatz durch die Verwendung von harter Filterung, sichtbarer Produktbehandlung und grobkörnigem Downranking.“

In einem Ingenieurwesen BlogeintragTwitter enthüllt mehr über die Empfehlungspipeline, die angeblich etwa fünf Milliarden Mal pro Tag läuft:

„Wir versuchen, die besten 1.500 Tweets aus einem Pool von Hunderten von Millionen zu extrahieren … Heute besteht die For You-Timeline zu 50 % aus [tweets from people you don’t follow] und 50% [tweets from people you follow] im Durchschnitt, obwohl dies von Benutzer zu Benutzer variieren kann“, schrieb Twitter. „Rangfolge [tweets] wird mit einem neuronalen Netzwerk mit ~48 Millionen Parametern erreicht, das kontinuierlich auf Tweet-Interaktionen trainiert wird, um für positives Engagement (z. B. Likes, Retweets und Antworten) zu optimieren.“

Die Veröffentlichung des Quellcodes erfolgt nach Kontroversen über Optimierungen des Empfehlungsalgorithmus. Entsprechend Plattformerforderte Elon Musk die Ingenieure von Twitter auf, den Algorithmus neu zu konfigurieren, damit seine Tweets mehr Aufmerksamkeit erregen würden.



tch-1-tech