Bellingcat veranstaltete Anfang dieses Monats seinen allerersten Hackathon, wobei sich die Veranstaltung auf die Entwicklung von Netzwerkanalyse-Tools konzentrierte. Wir waren beeindruckt von der Qualität der Projekte und hatten viel Spaß beim Kennenlernen der Entwickler, von denen viele an der Schnittstelle zwischen Open-Source-Forschung und Open-Source-Software arbeiten.
Wir freuen uns, ihre Abschlussprojekte hier mit einer kurzen Erläuterung ihrer Möglichkeiten vorzustellen, und hoffen, dass sie in Zukunft von Open-Source-Forschern verwendet werden. Darüber hinaus bietet Bellingcat den Entwicklern der Siegerprojekte Tech Fellowships zur Weiterentwicklung ihrer Tools an.
Netzwerkanalyse-Tools sind für Open-Source-Ermittler nützlich, da sie es ermöglichen, Verbindungen zwischen Gruppen, Einzelpersonen oder Gegenständen herzustellen, die möglicherweise auf eine Weise miteinander in Beziehung stehen, die mit bloßem Auge nicht immer ganz offensichtlich ist. Ein Netzwerk bezieht sich auf eine Sammlung digitaler Objekte, die als „Knoten“ bekannt sind, und die Verbindungen zwischen diesen Objekten, die als „Kanten“ bezeichnet werden.
Zum Beispiel nutzte Bellingcat-Mitarbeiter Benjamin Strick das Gephi-Netzwerkanalysetool, um ein Netzwerk von pro-indonesischen Bot-Konten zu identifizieren, die im Jahr 2019 Propaganda unter bestimmten Hashtags verbreiteten. In diesem Fall waren die Knoten Twitter-Konten und die Kanten zwischen ihnen deuteten darauf hin Ein Twitter-Konto hatte ein anderes Twitter-Konto erwähnt, mit „Gefällt mir“ markiert, retweetet oder zitiert. Wie die Teilnehmer unseres Hackathons gekonnt demonstriert haben, kann das gleiche Prinzip auf andere Social-Media-Plattformen (wie Facebook, VK, Reddit) oder große Datensätze (wie die in öffentlichen Unternehmensregistern) angewendet werden, wo Edges die Verbindung und das Verhalten zwischen ihnen zeigen können verschiedene Entitäten (oder Knoten).
Es muss beachtet werden, dass einige der unten aufgeführten Tools für ein Publikum mit einem überdurchschnittlichen technischen Verständnis entwickelt wurden. Dennoch hat jede ihren eigenen einzigartigen praktischen Nutzen und ihre eigene Fähigkeit, die Open-Source-Forschern in einer Vielzahl von Szenarien helfen könnten.
Bellingcat veranstaltet am Wochenende vom 23. bis 25. September einen weiteren Hackathon mit einem allgemeineren Fokus auf digitale Ermittlungstools. Wir haben noch Plätze frei, siehe unsere Ankündigung für weitere Informationen. Bewerber können sich einzeln oder als Team bewerben.
Top-Preise
Erster Platz: Socnet Dynamische Bildsuche, entwickelt vom Entwickler Ulysses, ist ein Tool zum Identifizieren von interessanten VK-Social-Media-Konten. Das Tool generiert ein soziales Netzwerk, indem es das Profil eines bestimmten VK-Kontos und der Freunde und Freunde von Freunden dieses Kontos scrapt. Es verwendet dann Das Clip-Modell von OpenAI Benutzern zu ermöglichen, innerhalb dieses Netzwerks nach Konten zu suchen, die Bilder gepostet haben, die mit einem bestimmten Ausdruck übereinstimmen, z. B. „Soldat“ oder „Flagge“. Den Juroren gefiel, wie gut die Bildsuche funktionierte und die klare Anwendbarkeit des Tools auf Open-Source-Ermittlungen im russischsprachigen Internet. Dieses Tool könnte verwendet werden, wenn ein Forscher ein VK-Konto eines russischen Soldaten hat und die Konten anderer mit ihm verbundener Soldaten finden möchte.
Zweiter Platz: GraphNAVI, entwickelt von Ilya Boyandin und Peter Kompasz, ist ein Tool, mit dem Benutzer eine tabellarische Datendatei hochladen, Knoten und Kanten (oder interessante Elemente und Verbindungen zwischen ihnen) mithilfe von SQL-Anweisungen aus den Daten auswählen und das Netzwerk visualisieren können. Das Tool kann unter angezeigt werden GraphNAVI-Website. Den Juroren gefiel, dass es eine End-to-End-Lösung bietet, die mehrere Schritte in einem typischen Netzwerkanalyse-Workflow abdeckt, sowie die technische Innovation des Backends. Dieses Tool könnte verwendet werden, wenn ein Forscher eine tabellarische Datendatei (CSV oder Parquet) hat und einfach eine Netzwerkvisualisierung generieren möchte, ohne ein Konvertierungsskript schreiben oder die kompliziertere Schnittstelle von Gephi verwenden zu müssen. Die Möglichkeit, Visualisierungsparameter zu optimieren, einschließlich Schwellenwertkantengewichtungen (dh das Verwerfen weniger wichtiger Verbindungen), kann auch für das iterative Prototyping einer Visualisierung nützlich sein.
Dritter Platz: Grafiker, entwickelt von Alex Trefilov, ist ein Tool zum Erstellen von Netzwerkdiagrammen. Es ermöglicht Benutzern, Knoten hinzuzufügen, zu bearbeiten und zu entfernen, die Diagrammvisualisierung zu exportieren und das Diagramm mithilfe integrierter Scraping-Module, einschließlich eines Twitter-Scrapers, zu erweitern. Die Juroren mochten die einfach zu bedienende Benutzeroberfläche und wie gut sie den zuvor festgestellten Bedarf an einem Tool zum Zeichnen einfacher Netzwerkdiagramme erfüllte. Dieses Tool könnte verwendet werden, wenn ein Forscher eine gut aussehende, relativ kleine Netzwerkvisualisierung für einen Nachrichtenartikel oder eine Veröffentlichung erstellen möchte, ohne eine Bildbearbeitungssoftware oder eine kompliziertere Netzwerksoftware verwenden zu müssen.
Am wirkungsvollsten
Zuckerspurentwickelt von Sean Greaves, ist eine Schnittstelle zum britischen Unternehmensregister, Firmenhaus, das es Benutzern ermöglicht, Unternehmen und Personen zu finden, die auf verschiedene Weise miteinander verbunden sind, z. B. Unternehmen mit derselben Person im Vorstand oder Unternehmen, die unter derselben Adresse registriert sind. Siehe Seans Jupyter Notebook-Lernprogramm für ein Beispiel für die Verwendung des Tools in einer Untersuchung. Den Richtern gefiel das ausführliche Tutorial, das zeigte, wie es verwendet werden könnte, um einen potenziell verdächtigen Geschäftsinhaber zu untersuchen. Dieses Tool könnte verwendet werden, wenn ein Forscher die Identität eines bestimmten Unternehmens oder Vorstandsmitglieds hat und andere Unternehmen und damit verbundene Unternehmensleiter finden möchte.
Von der Reddit-Analyse bis zur Verfolgung russischer Propaganda
Weitere Projekte, die aus dem Hackathon hervorgehen werden, sind unten zusammen mit Links aufgelistet, damit jeder Interessierte die Tools selbst ausprobieren kann. Diese Tools sind in alphabetischer Reihenfolge aufgeführt.
Gordisch, entwickelt von John Rodley, Eric Brichetto und Ryan Willett, ist ein Tool, das Dienstprogramme zum Extrahieren von Diagrammdaten aus tabellarischen Datendateien und zum Konvertieren zwischen mehreren Diagrammdateiformaten bereitstellt. Dieses Tool könnte verwendet werden, wenn ein Forscher eine Datendatei in einem Format hat (z. B. Graph Modeling Language) und sie in ein Format konvertieren möchte, das von einer bestimmten Netzwerkvisualisierungssoftware unterstützt wird.
Graph-Modellierer, entwickelt von Henry Legge und John Smith, ist ein Tool, mit dem Benutzer Google- und Bing-Suchergebnisse vergleichen und gemeinsame Schlüsselwörter von Ergebnisseiten in einem Netzwerkdiagramm visualisieren können. Dieses Tool könnte verwendet werden, wenn ein Forscher das relevanteste Ergebnis einer Suchmaschine finden oder verstehen möchte, wie Ergebnisseiten miteinander zusammenhängen.
Grafikentwickelt von Terence Denning und Richard Theuma, ist ein Tool, mit dem Benutzer eine GEXF Graph-Datei und visualisieren Sie das Netzwerk einfach, sowie zeigen Sie Knoteneigenschaften und Nachbarinformationen an. Dieses Tool könnte verwendet werden, wenn ein Forscher eine GEXF-Grafikdatei hat und eine einfache Visualisierung generieren möchte, ohne die Parameter anderer Visualisierungstools wie Gephi installieren oder konfigurieren zu müssen.
Reddit-Netzwerkanalyse-Tool, entwickelt von cbot, ist ein Tool, das die Posts eines Subreddits kratzt und Netzwerkgrafikdateien von Reddit-Benutzern generiert, die im selben Subreddit posten, und von Subreddits, die Posts von denselben Benutzern haben. Dieses Tool könnte verwendet werden, wenn ein Forscher an einem bestimmten Subreddit interessiert ist und ähnliche Subreddits finden möchte.
RTAA-72entwickelt von Dimitris Papaevagelos aus CVCIO, ist ein Echtzeit-Dashboard zur Überwachung nicht authentischer Konten und Fehl-/Desinformationsnarrative auf Twitter. Dieses Tool könnte verwendet werden, wenn ein Forscher eine bestimmte Propaganda-Erzählung auf Twitter in Echtzeit verfolgen und die Netzwerkstruktur von Konten sehen möchte, die diese Erzählungen vertreten.
Schrottentwickelt von Matticus Hunt und Ryan, ist ein Tool zum Extrahieren von Outlinks aus der Ausgabe von snscrapes Twitter-User Scraper (der Details wie Benutzerprofile, Hashtags und Suchanfragen sammelt). Dieses Tool könnte verwendet werden, wenn ein Forscher die Websites finden möchte, mit denen ein bestimmtes Twitter-Konto verknüpft ist.
Spevktator, entwickelt von MischaU8 & Morsaki, ist eine Schnittstelle zu einer Datenbank mit VK-Beiträgen von russischen Nachrichtensendern, die zur Recherche von russischen Propagandaerzählungen im Inland verwendet werden kann. Die Schnittstelle wird mit Strom versorgt Datasette Werkzeug und kann aus dem angezeigt werden Spevktator-Website. Dieses Tool könnte verwendet werden, wenn ein Forscher bestimmte Narrative der russischen Staatspropaganda verfolgen möchte. Wenn ein technisch versierterer Forscher eine Reihe von VK-Konten hat, an denen er interessiert ist, kann er alternativ seine eigene Instanz des Tools ausführen, um die Posts dieser Konten zu überwachen und zu analysieren.
Twitter-Analyse und Netzwerkvisualisierung (TANV), entwickelt von Timo Damm und Jakob Hauser, ist ein Tool, das Post-Informationen von einem bestimmten Twitter-Konto kratzt und eine Netzwerkvisualisierung aller Konten generiert, die mit diesem Konto interagiert haben. Dies könnte verwendet werden, wenn ein Forscher an einem bestimmten Twitter-Konto interessiert ist und andere damit verknüpfte Konten finden möchte.
Twitter-Trendanalyse, entwickelt von Shivansh Sethi und Rohit, ist ein Dashboard, das Analysen von Tweets bereitstellt, die bestimmte Hashtags enthalten. Das Dashboard soll es auch erleichtern, nicht authentische Konten zu erkennen. Das Tool soll Benutzern helfen, Bot- oder Propaganda-basiertes Verhalten über einen bestimmten Zeitraum zu analysieren. Dieses Tool könnte verwendet werden, wenn ein Forscher an einem bestimmten Twitter-Hashtag interessiert ist und feststellen möchte, ob die Konten, die ihn verstärken, authentisch sind oder nicht.
Bellingcat ist gemeinnützig und die Fähigkeit, unsere Arbeit auszuführen, hängt von der freundlichen Unterstützung einzelner Spender ab. Wenn Sie unsere Arbeit unterstützen möchten, können Sie das tun hier. Sie können auch unseren Patreon-Kanal abonnieren hier. Abonnieren Sie unsere Newsletter und folgen Sie uns auf Twitter hier.
Wenn Sie daran interessiert sind, Online-Forschern dabei zu helfen, mehr über die technischen Tools und Methoden zu erfahren, die Open-Source-Untersuchungen verbessern können, bewerben Sie sich für Bellingcats Tech Team Fellowship von Oktober bis Dezember 2022. Wir suchen Kandidaten mit der Fähigkeit, komplexe technische Themen in kleine Schritte und eine leicht verständliche Sprache herunterzubrechen.