Neue Tools dringen tiefer in schwer zu aggregierende US-Unternehmensdaten ein

Möchten Sie Muster im Unternehmensverhalten aufdecken, ein Unternehmen von Interesse im Auge behalten oder Zugang zu kostenlosen und genauen Finanzdaten für Open-Source-Recherchen erhalten? Wenn ja, sollten Sie die Verwendung von Electronic Data Gathering, Analysis and Retrieval (EDGAR) in Betracht ziehen.

Diese Datenbank mit Unternehmens- und Finanzdaten, die von der US-Börsenaufsicht SEC (Securities and Exchange Commission) verwaltet wird und kostenlos zugänglich ist, enthält Millionen von Einreichungen börsennotierter Unternehmen, die bis ins Jahr 1994 zurückreichen Finanzanalysten.

Ein Screenshot der EDGAR-Homepage auf der Website der Security and Exchange Commission

Ein Grund für die unzureichende Nutzung liegt darin, dass viele potenzielle Benutzer EDGAR einfach nicht kennen und sich am Ende bei einem oder mehreren Unternehmensdatenanbietern anmelden. Ein weiterer Grund ist, dass sie mit EDGAR nur allzu vertraut sind, insbesondere mit den frustrierenden Mängeln seiner Benutzeroberfläche:

  • Benutzer können nicht alle Dokumente, die durch eine Textsuche in der Datenbank zurückgegeben werden, auf einmal herunterladen
  • Aufgrund der Verschiebung von Daten-Tags ist es äußerst umständlich, Finanzprofile für einzelne Unternehmen zu erstellen oder Vergleiche zwischen ihren jeweiligen Finanzkennzahlen durchzuführen
  • Es gibt keine Funktion zum Abonnieren eines einzelnen RSS-Feeds mehrerer Unternehmen, die Sie interessieren könnten
  • Um diese Mängel zu beheben, haben wir eine Reihe von Tools entwickelt, von denen wir hoffen, dass sie mehr Menschen dazu ermutigen, EDGAR für Unternehmens- und Finanzforschung zu nutzen. Mit diesen Tools können Benutzer die Ergebnisse von Suchbegriffen programmgesteuert in EDGAR speichern, ein Finanzprofil jedes an einer US-Börse gehandelten Unternehmens erstellen und den umfassendsten RSS-Feed von EDGAR nach Unternehmen filtern, die sie interessieren.

    Unser Ziel war es, diese Ressourcen einem möglichst breiten Publikum zugänglich zu machen. Daher sind mit Ausnahme unserer Finanzdatentabellen nur Grundkenntnisse in Python erforderlich. Sie können auf unsere Tools zugreifen Hier.

    Suchen Sie nach Begriffen in der EDGAR-Datenbank und speichern Sie die Ergebnisse programmgesteuert

    Das erste unserer Tools macht es einfach, Suchergebnisse von EDGAR aufzuzeichnen und stellt Daten kostenlos zur Verfügung, für die andere exorbitante Geldbeträge von Drittanbietern zahlen.

    Ein wiederkehrendes Thema im Wall Street Journal ist beispielsweise die abnehmende Bedeutung von Umwelt-, Sozial- und Governance-Prinzipien (ESG), was sich in der Zahl der vierteljährlichen Gewinnaufrufe widerspiegelt, in denen die Unternehmensführung ESG-Themen thematisiert. ESG umfasst Anlagestrategien, die die soziale Verantwortung von Unternehmen berühren, und kann alles umfassen, von Investitionen in CO2-Ausgleich und grüne Technologie bis hin zu Strategien, die Investitionen in Lieferketten mit unterdurchschnittlichen Arbeitsnormen vermeiden. In Juni Und September In mehreren Artikeln zu diesem Thema führte das WSJ Daten, die den Rückgang der Erwähnungen von ESG bei Führungskräften belegen, auf AlphaSense bzw. FactSet zurück. Die Abonnements beider Dienste kosten mehrere Tausend Dollar pro Jahr.

    Glücklicherweise können wir die Textsuche nutzen, um einen ähnlichen ESG-Trend kostenlos anzuzeigen, indem wir in den bei EDGAR eingereichten Jahres- und Quartalsberichten nach dem Begriff „ESG“ suchen:

    Diagramm mit Unternehmensanmeldungen, die sich auf ESG beziehen, unter Verwendung von Daten, die mit dem Texttool aus EDGAR abgerufen wurden

    Mit diesen Daten können wir auch die Unternehmen hervorheben, die ESG am häufigsten erwähnen:

    Diagramm, das die Unternehmen zeigt, die ESG in ihren Einreichungen am häufigsten erwähnen, unter Verwendung von Daten, die mit dem Texttool aus EDGAR abgerufen wurden

    Die Verwendung der EDGAR-Datenbank zur Darstellung umfassender Trends über Hunderttausende von Einreichungen ist möglich, da unser Tool die Suche automatisch in überschaubare Abschnitte aufteilt, jede Ergebnisseite durchsucht und die Daten im .csv-Format anhängt, was weiter sein kann in Excel oder, wie in diesem Fall, in der Plotly-Bibliothek in Python ausgenutzt.

    Jede Ergebniszeile in der zurückgegebenen CSV-Tabelle enthält das Datum, die Gerichtsbarkeit, in der die juristische Person registriert ist, ihren Hauptgeschäftssitz, ihren Namen, eine eindeutige Identifikationsnummer oder den zentralen Indexschlüssel (Central Index Key, CIK) sowie eine URL für den Archivierungsindex (der ggf enthalten zusätzliche Dokumente und Informationen) und den Link zur eigentlichen Einreichung. Wie die ESG-Daten zeigen, ist es manchmal nicht einmal notwendig, die Einreichungen selbst zu öffnen, um interessante Muster zu entdecken – die Tabellendaten reichen aus.

    Erhalten Sie ein vollständiges Finanzprofil aller an einer US-Börse gehandelten Unternehmen

    Mit unserem zweiten Tool können Benutzer ein einzigartiges Profil jedes Unternehmens erstellen, das an einer US-Börse gehandelt wird. Allein an der New York Stock Exchange und dem Nasdaq Stock Market gibt es über 2300 bzw. 3600 börsennotierte Unternehmen.

    Jedes Unternehmen, dessen Aktien der Öffentlichkeit zugänglich sind, muss der SEC regelmäßig seine Finanzdaten melden. Diese Finanzdaten sind in den Text- und .htm-Versionen der Einreichungen enthalten und werden auch im XBRL-Format gespeichert, das ein System von Daten-Tags oder Taxonomien verwendet, um sicherzustellen, dass Datenpunkte über die Zeit und über verschiedene Unternehmen hinweg konsistent sind.

    Wenn ein Unternehmen beispielsweise die Anzahl der ausstehenden Aktien verfolgt, die es während eines Berichtszeitraums besaß, könnten im Text und in den Tabellen seines Berichts die Begriffe „Stammaktien“, „ausstehende Aktien“ oder „Basisaktien“ verwendet werden. Allerdings kann die Anzahl der ausstehenden Aktien eines Unternehmens im XBRL-Dokument mit einem von rund einem Dutzend von seinen Buchhaltern ausgewählten Tags verknüpft sein.

    Diese Tags können sich von Jahr zu Jahr und von Unternehmen zu Unternehmen ändern, was dazu führt, dass EDGARs Datensätze mit Finanzdaten ohne Verarbeitung kaum von Nutzen sind. Durch das Studium der von der XBRL Foundation veröffentlichten Taxonomiedokumente, einen Crashkurs in Buchhaltung und den Einsatz semantischer und numerischer Zuordnung konnten wir ein allgemeines Schema für die Zuordnung eines einfachen englischen Begriffs für rund hundert häufig verwendete Finanzdaten erhalten Punkte.

    Unter Verwendung dieser Term-Matching-Bibliothek als Referenz haben wir eine einzige Tabelle mit Finanzdaten erstellt, die alle Unternehmen abdeckt, die der SEC Bericht erstatten. Wir arbeiten kontinuierlich an der Verbesserung der Tabelle, um wichtige Verbesserungsbereiche anzugehen, darunter:

  • Analysieren von Daten für Nicht-US-Unternehmen
  • Umgang mit fehlenden Daten/Tippfehlern in EDGAR-Daten
  • Fehler in der Genauigkeit der aktuellen Parsing-Methode
  • In seiner aktuellen Form ermöglicht uns der Datensatz, für die meisten Unternehmen und für die meisten Jahre kohärente und genaue Datenzeitreihen zu erstellen. Hier sehen wir den sinkenden Nettogewinn (Gewinn) des Finanzdienstleistungsunternehmens Morningstar, das, wie wir oben gesehen haben, eines der Unternehmen ist, die am meisten mit ESG-Investitionen in Verbindung gebracht werden:

    Ein Diagramm, das das Nettoeinkommen von Morningstar im Zeitverlauf anhand von Daten von EDGAR zeigt

    RSS-Feed-Anpassung

    Mit unserem letzten Tool können Benutzer wertvolle Informationen aus den RSS-Feeds von EDGAR abrufen, die es derzeit schwierig machen, aktuelle Informationen zu einzelnen Unternehmen zu finden.

    EDGAR veröffentlicht mehrere RSS-Feeds, die täglich einen Überblick über neue Anmeldungen bieten. Während es möglich ist, einzelne Unternehmens-Feeds zu abonnieren, ist es aufwändig, mehreren Unternehmen über mehrere Abonnements zu folgen.

    Wir finden es praktischer, auf einen der wichtigsten RSS-Feeds zuzugreifen und die Ergebnisse dann nach interessanten Unternehmen zu filtern.

    Zu diesem Zweck haben wir ein einfaches Tool entwickelt, das es dem Benutzer ermöglicht, eine Liste der für ihn interessanten Aktien einzugeben und dann eine Anfrage an den umfassendsten RSS-Feed von EDGAR zu senden, der sowohl XBRL- als auch Nicht-XBRL-Einreichungen enthält. Das Tool gibt eine CSV-Datei in einem Format zurück, das dem Textsuchtool ähnelt, mit Entitätsdatum, Entitätsname, Ticker, Ablagetyp, CIK-Nummer und Links zur Ablage und ihrem Index.

    Wie das Textsuchtool eignet sich auch das RSS-Tool für Rechercheanfragen mit engem oder weitem Fokus. Wir können beispielsweise eine Gruppe von Unternehmen im Auge behalten, die uns interessieren, oder alternativ die ungefilterten Tagesergebnisse nutzen, um am Puls des breiteren Marktes zu bleiben. Ein besonders fruchtbarer Anwendungsfall besteht darin, alle täglichen Einreichungen in ein LLM einzuspeisen, um prägnante Zusammenfassungen der Einreichungstexte zu erstellen und zu speichern.

    Eine letzte Anmerkung

    Diese Tools sind in Arbeit und müssen möglicherweise an mögliche Änderungen im Umfang und Format von EDGAR angepasst werden. Darüber hinaus hoffen wir, dieses Toolset als Reaktion auf Ihr Feedback und die vorgeschlagenen Anwendungsfälle anpassen und erweitern zu können. Bitte wenden Sie sich entweder an Bellingcat oder an George Dyer von Marktinferenz Wir freuen uns über Ihre Kommentare und Fragen und helfen Ihnen gerne weiter.

    Unser Ziel ist es sicherzustellen, dass die EDGAR-Datenbank von einem möglichst breiten Personenkreis in vollem Umfang genutzt wird.

    Bellingcat ist eine gemeinnützige Organisation und die Fähigkeit, unsere Arbeit auszuführen, hängt von der freundlichen Unterstützung einzelner Spender ab. Wenn Sie unsere Arbeit unterstützen möchten, können Sie dies hier tun. Sie können auch unseren Patreon-Kanal abonnieren Hier. Abonnieren Sie unsere Newsletter und folge uns auf Instagram HierX Hier und Mastodon Hier.



    bllc-allgemeines