Verwendung der Wayback Machine und Google Analytics zur Aufdeckung von Desinformationsnetzwerken

Google Analytics ist ein beliebter Dienst zum Verfolgen und Analysieren des Traffics auf einer Website. Über einen kurzen Code, der in der Quelle einer Website platziert wird, kann ein Benutzer die Leistung aller seiner Online-Eigenschaften überwachen. Diese Tracking-Codes können auch eindeutig anzeigen, wenn mehrere Websites von einem einzelnen Benutzer oder einer einzelnen Entität betrieben werden – was bedeutet, dass sie für Open-Source-Forscher ein besonders nützlicher Breadcrumb waren.

Aber es gibt einen Haken: Google lässt diese Codes auslaufen und ersetzt sie durch Codes, die weniger Daten enthalten und es schwieriger machen, zu verfolgen, wer die Websites kontrolliert.

Um dieses Problem anzugehen, hat Bellingcat ein leichtes Open-Source-Recherchetool entwickelt:Wayback Google Analytics – das die Erfassung von Tracking-Codes und die Erkennung von Beziehungen zwischen Websites mithilfe von Kopien von Websites automatisiert, die von Wayback Machine des Internet Archive verwaltet werden. Dies wird Forschern helfen, die jüngsten Änderungen in der Art und Weise zu umgehen, wie Google seine Analysedaten verwaltet.

Ein Screenshot einer Wayback Machine-Aufnahme einer ehemaligen Desinformationswebsite mit Verbindungen zu Russland

Was ist ein Google Analytics-Code?

Google verwendet eine Reihe einzigartiger Tracking-Codes, um Analysedaten auf Websites zu sammeln. Über ein Jahrzehnt lang war der beliebteste Google-Tracking-Code die Universal Analytics (UA)-ID: ein kleiner Tracker, der in einem Skript-Tag im Quellcode einer Webseite versteckt war.

Ein UA-Code sieht so aus:

UA-123456789-1

Hier gibt es viele nützliche Informationen. Der Center-Code ist eine eindeutige Tracking-ID, die an mehrere Websites vergeben wird, die von demselben Benutzer oder derselben Entität verwaltet werden. Die nachgestellte Ziffer trennt mehrere Online-Eigenschaften, die dieser Entität gehören (z. B. UA-123456789-1, UA-123456789-2 usw.).

Die Verfolgung von UA-Codes ist eine grundlegende Strategie im OSINT-Toolkit, die regelmäßig von Ermittlern verwendet wird. Im Jahr 2017 nutzten Journalisten in Südafrika Google Analytics-Daten, um eine koordinierte Desinformationskampagne aufzudecken, die von einem Mitglied der berüchtigten Milliardärsfamilie Gupta finanziert und geleitet wurde. Im Jahr 2015 nutzte der Bellingcat-Mitarbeiter Lawrence Alexander dieselbe Methode, um Dutzende Websites, die kremlfreundliche Narrative über Syrien und die Ukraine verbreiteten, mit einer einzigen Person mit Sitz in St. Petersburg, Russland, zu verbinden. In beiden Fällen waren gemeinsame UA-Codes zwischen mehreren Webseiten ein wichtiger Datenpunkt in der Untersuchung.

Allerdings wird die Durchführung einer solchen Untersuchung im Jahr 2023 aufgrund weitreichender Änderungen bei der Verwaltung seiner Tracking-IDs durch Google deutlich schwieriger.

Google Analytics 4

Anfang dieses Jahres hat Google Google Analytics 4 eingeführt – ein neues Analyse-Framework, das UA-Codes durch weniger einheitliche Tracking-IDs ersetzt, aus denen sich deutlich schwieriger Informationen gewinnen lassen. Es ist nicht mehr möglich, einen neuen UA-Code zu erhalten, und die meisten großen Websites haben ihre Tracking-IDs auf die neuen G- und GTM-Codes aktualisiert.

Für die Ermittler seien das schlechte Nachrichten, so ProPublica-Reporter Craig Silverman erklärt früher in diesem Jahr. Während GTM- und G-Codes immer noch lohnenswerte Brotkrümel sind, führen weniger Online-Dienste Datenbanken dieser Tracker. Darüber hinaus gibt es kein nützliches Suffix mehr, das anzeigt, wenn mehrere Websites denselben Tracking-Code verwenden.

Es gibt jedoch eine gute Nachricht: Google sagt, dass es nicht plant, Websites zu zwingen, bestehende UA-Codes zu entfernen, und mit der Zeit werden wahrscheinlich mehr Dienste damit beginnen, G- und GTM-Codes zu katalogisieren, um Beziehungen zwischen Websites zu finden.

In der Zwischenzeit können wir weiterhin ältere UA-Codes von Websites extrahieren, die sie weiterhin verwenden. Darüber hinaus können wir mit der Wayback Machine auch den Quellcode früherer Websites untersuchen und überlappende UA-Codes finden.

Verwendung von Wayback Google Analytics

Wayback Google Analytics von Bellingcat automatisiert das Sammeln von Analysecodes und die Überprüfung ihrer Nutzung auf mehreren Websites. Wir können dem Tool eine Liste von Websites, einen Zeitraum und ein gewünschtes Ausgabeformat (.csv, .json usw.) geben, sodass wir schnell einen Überblick über alle zwischen Websites ausgetauschten Daten erhalten.

Eine ausführlichere Anleitung zur Nutzung und Installation finden Sie auf unserer Seite Github Seite, aber schauen wir uns an, wie ein typischer Anwendungsfall aussehen könnte. Wir werden einige (inzwischen nicht mehr existierende) mit Russland verknüpfte Desinformationswebsites verwenden, die in einer früheren Bellingcat-Untersuchung behandelt wurden, um den Nutzen des Tools zu demonstrieren.

  • https://yapatriot.ru
  • https://zanogu.com
  • https://whoswho.com.ua
  • https://adamants.ru
  • Wir gehen davon aus, dass wir nur Daten von 2015 bis heute benötigen. Da wir nach Zusammenhängen zwischen den Websites suchen, geben wir die Daten in eine Excel-Tabelle aus. Unser Befehl sieht so aus:

    wayback-google-analytics -u https://yapatriot.ru https://zanogu.com https://whoswho.com.ua https://adamants.ru -s 01/01/2015 -f jährlich -o xlsx

    (In diesem Befehl sind noch einige andere Parameter enthalten – schauen Sie sich unsere an Liesmich für eine vollständige Liste der Optionen)

    Wayback Google Analytics generiert dann eine Excel-Tabelle, die die Analysecodes meldet, die von jeder Website verwendet wurden, sowie wann sie zum ersten und letzten Mal bei unserer Suche gefunden wurden. In diesem Fall sind diese Websites nicht mehr aktiv, daher verfügen wir nur über archivierte Daten, die von der Wayback Machine stammen.

    Wir können die Daten auch nach Code anzeigen:

    In den oben genannten Daten haben „whoswho.com.ua“, „yapatriot.ru“ und „zanogu.com“ jeweils denselben Basiscode – ein Hinweis darauf, dass sie möglicherweise von derselben Entität betrieben werden.

    Wayback Google Analytics ist ein Open-Source-Projekt, zu dem jeder beitragen kann. Besuchen Sie Bellingcat’s Github Seite, um Beitragsrichtlinien anzuzeigen oder sich die aktiven Projekte dieses Projekts anzusehen Probleme um loszulegen.

    Bellingcat ist eine gemeinnützige Organisation und die Fähigkeit, unsere Arbeit auszuführen, hängt von der freundlichen Unterstützung einzelner Spender ab. Wenn Sie unsere Arbeit unterstützen möchten, können Sie dies hier tun. Sie können auch unseren Patreon-Kanal abonnieren Hier. Abonnieren Sie unsere Newsletter und folge uns auf Instagram HierX Hier und Mastodon Hier.



    bllc-allgemeines