Acht überraschende Dinge, die die Datenwissenschaft in den letzten zehn Jahren über uns enthüllt hat

Soul Hackers 2 Erscheinungsdatum Ankuendigungstrailer enthuellt

Big-Data-Analysen werden seit langem unterstützt Haupttaten in Physik und Astronomie. Aber in jüngerer Zeit haben wir gesehen, dass es Durchbrüche in den Sozial- und Geisteswissenschaften untermauert.

Seit dem wegweisenden Papier „Computational Social Science“ wurde 2009 veröffentlicht, eine neue Generation von Datenanalyse-Tools hat Forschern Einblicke in grundlegende Fragen darüber gegeben, wie wir kommunizieren, wer wir sind und was wir schätzen.

Durch die Analyse der relativen Häufigkeit bestimmter Wörter in historischen Texten können Forscher beispielsweise wichtige Veränderungen in unserem Sprachgebrauch im Laufe der Zeit identifizieren.

In einigen Fällen werden diese Verschiebungen offensichtlich sein, wie zum Beispiel die Verwendung archaischer Wörter, die durch modernere Wörter ersetzt werden. Aber in anderen Fällen können sie subtilere, aber weit verbreitete soziale und kulturelle Veränderungen widerspiegeln. Nachfolgend sind einige der einflussreichsten datenzentrierten Entdeckungen der letzten 10 Jahre aufgeführt.

Wie wir kommunizieren

In den letzten zehn Jahren hat eine wachsende Zahl globaler offener Datenquellen Forschern dabei geholfen, Muster darin aufzudecken, was wir lesen, schreiben und worauf wir achten. Google Bücher, Weltkatze und Projekt Gutenberg sind nur einige Beispiele.

Die Veröffentlichung von Google Books N-Gramm-Viewer in den frühen 2010er Jahren war ein Game Changer an dieser Front. Dieses Tool verwendet die gesamte Google Books-Datenbank und zeigt Ihnen die relative Häufigkeit eines bestimmten Begriffs oder Ausdrucks, wie er über Hunderte von Jahren verwendet wurde. Forscher haben diese Daten verwendet, um die systematische Unterdrückung der Erwähnung jüdischer Maler wie Marc Chagall in deutschen Büchern während des Zweiten Weltkriegs zu untersuchen.

Die Datenanalyse kann auch Muster im Ausdruck menschlicher Emotionen im Laufe der Zeit aufdecken. CSIROs Wir fühlen verfolgt Emotionen in Gemeinschaften auf der ganzen Welt. Dies geschieht, indem die Sprache, die Menschen in sozialen Medien verwenden, in Echtzeit analysiert und kartiert wird.

Das Tool kann verwendet werden, um die allgemeine Stimmung über die Zeit (Stunde für Stunde, Tag für Tag) in bestimmten Städten und Ländern zu bestimmen. Muster in diesen Daten können dann in Verbindung mit anderen Informationen wie Wetter, Feiertagen und wirtschaftlichen Schwankungen untersucht werden.

Einige Forschungsergebnisse behaupten sogar, grundlegende Veränderungen in den sozialen Werten der Menschen, der Gemeinschaftsstimmung und unserer Denkweise darzustellen (z. B. den Aufstieg und Fall von Wörtern, die mit Rationalität in Verbindung gebracht werden, wie „Methode“, „Analyse“ und „bestimmen“).

Hier sind einige wichtige Erkenntnisse in diesem Bereich:

Der kulturelle Umsatz beschleunigt sich

Eine von der Harvard University geführte Analyse von mehr als einem Jahrhundert an Daten aus Millionen von Büchern beweist, dass die Aufmerksamkeitsspanne der Gesellschaft für historische Ereignisse abnimmt, während der Appetit auf neues Material wächst.

Mit anderen Worten, wir vergessen die Vergangenheit schneller. Sie können dies in der folgenden Grafik sehen, die zeigt, wie oft drei bestimmte Jahre in einer Vielzahl von Literatur im Laufe der Zeit erwähnt werden. Mit der Zeit vergeht die „Halbwertszeit“ jedes Jahres (der Punkt, an dem es nur noch halb so viel Aufmerksamkeit erhält wie auf seinem Höhepunkt).

Die Vielfalt der menschlichen Sprache und die Biodiversität korrelieren

Durch die Kartierung der sprachlichen Vielfalt und der Vielfalt der Tierarten haben die Forscher gezeigt Diese beiden Welten sind geografisch korreliert – beide nehmen mit der Temperatur und der Nähe zum Äquator zu. Je näher man also dem Äquator kommt, desto mehr Variationen gibt es in der gesprochenen Sprache und desto größer ist die Artenvielfalt.

Die Autoren schlagen vor, dass dies auf die Hitze in der Nähe des Äquators zurückzuführen ist, die eine größere Produktivität und Vielfalt in der Pflanzenwelt erzeugt, was wiederum komplexere und interaktivere Umgebungen für Tiere und Menschen gleichermaßen bietet – und sich in einen Kreislauf einfügt, in dem „Vielfalt mehr Vielfalt erzeugt“.

Im Laufe des letzten Jahrhunderts gab es gesellschaftsweite Verschiebungen im Sprachgebrauch

In einem Artikel veröffentlicht im Dezember verwendeten Forscher maschinelles Lernen, um langfristige, konsistente Veränderungen in unserem Sprachgebrauch aufzuzeigen. Insbesondere offenbaren sie einen Wendepunkt in den 1980er Jahren, wo es eine Verschiebung hin zu einer egozentrischeren, emotionaleren und angeblich weniger rationalen Sprache gibt.

Die Autoren schlagen vor (obwohl nicht ohne Wettbewerb) könnte dies den Beginn einer „post-faktischen Ära“ signalisieren.

Wer wir sind

Auf dem Gebiet der Psychologie haben die gleichen Datenanalyse-Tools gezeigt, dass die Persönlichkeit von Menschen anhand der „Big 5“-Merkmale gemessen werden kann, die weitgehend werden im Erwachsenenalter stabil.

Möglich wurde dies durch umfangreiche Datensätze wie HILDA in Australien, das Deutsche Sozio-oekonomische Panel in Deutschland und das British Household Panel Survey in Großbritannien.

Robuste Studien haben auch gezeigt, dass Persönlichkeitsmerkmale zuverlässig und genau aus einer Vielzahl von Datenquellen vorhergesagt werden können, darunter Sprachaufnahmen, Handy-Nutzungsmuster und selbst Porträtfotografien.

Im Gegenzug wurden einige bemerkenswerte Assoziationen zwischen Persönlichkeit und:

Elevation

Eine 2020 veröffentlichte Studie, die auf Daten von mehr als drei Millionen Menschen basiert, zeigt an Menschen, die in den Bergen leben, haben tendenziell andere Persönlichkeitsmerkmale als diejenigen, die auf Meereshöhe leben. Sie sind im Allgemeinen offener für neue Erfahrungen und emotional stabiler.

Standort

Eine andere frühere Studie zeigt, dass Menschen, die in den Vereinigten Staaten leben, unterteilt werden können drei klare und messbare Cluster von Persönlichkeitstypen, verknüpft mit zugehörigen geografischen Fußabdrücken. New Yorker und Texaner (die sich im selben Cluster befinden) sind eher temperamentvoll und hemmungslos.

Beruf

In unserer 2019 mit Kollegen veröffentlichten eigenen Studie haben wir die Persönlichkeitsmerkmale von Menschen in mehr als 1.000 verschiedenen Berufen analysiert. Wir fanden Menschen in der gleichen Rolle haben ähnliche Eigenschaften. Wissenschaftler sind noch offener für neue Ideen bereit zu argumentierenwährend Tennisprofis eher freundlich und aufgeschlossen sind.

Die Forschung verwendete maschinelles Lernen, um die Persönlichkeitsmerkmale von mehr als 100.000 Menschen basierend auf der in sozialen Medien verwendeten Sprache abzuleiten.

Was wir schätzen

In der Wirtschaftswissenschaft sehen wir, dass dank der Datenanalyse große Forschungsgrenzen eröffnet werden, unter anderem in:

Netzwerkwissenschaft

Wenn es um Erfolg geht, haben wir gelernt, dass Leistung am wichtigsten ist, wenn sie gemessen werden kann (wie im Sport). Aber in anderen Bereichen, wo es nicht einfach gemessen werden kann (wie in der Kunstwelt), Netzwerke Gegenstand die meisten.

Verhaltensökonomie

Wir können jetzt sehen, wie wir uns als Individuen verhalten en masse, die wertvolle Hinweise für wirksame politische Interventionen in den Bereichen Beschäftigung, Besteuerung und Bildung enthüllt. Zum Beispiel eins großangelegte Studie zeigten, dass diejenigen, die am schnellsten wieder in den Arbeitsmarkt einstiegen, bestimmte Schlüsselverhaltensweisen zeigten. Dazu gehörten, Frühaufsteher zu sein und geografisch mobil zu sein (was vielleicht bedeutet, dass sie eher bereit sind, für die Arbeit weiter zu reisen oder umzuziehen).

Posttheoretische Wissenschaft?

Einige haben argumentiert, dass die Datenwissenschaft eine grundlegende Herausforderung für die traditionellen Wissenschaften darstellt, mit dem Aufkommen von „Posttheoretische Wissenschaft„. Dies ist das Konzept, dass Maschinen die Beziehung zwischen Daten und Realität besser verstehen als die traditionelle wissenschaftliche Methode hypothetisieren, vorhersagen und testen.

Allerdings berichten die Tod der Theorie sind vielleicht stark übertrieben. Daten sind nicht perfekt. Und Data Science, die auf unvollständigen oder voreingenommenen Daten basiert, hat das Potenzial, wichtige Muster menschlicher Aktivitäten zu übersehen oder zu verschleiern. Dies kann nur durch kritisches Denken und Theorie angegangen werden.

Bereitgestellt von The Conversation

Dieser Artikel wird neu veröffentlicht von Die Unterhaltung unter einer Creative-Commons-Lizenz. Lies das originaler Artikel.

ph-tech