Was bietet künstliche Intelligenz, die über traditionelle statistische Modelle wie die Regressionsanalyse hinausgeht, um das Verhalten von Haushalten zu untersuchen, insbesondere die Faktoren, die zur Trennung von Paaren und zur Auflösung der ehelichen Bindung führen?
Mit Bruno Arpino (Universität Florenz) und Marco Le Moglie (Katholische Universität Mailand) haben wir Daten von über 2.000 deutschen verheirateten oder zusammenlebenden Paaren analysiert, die im Durchschnitt ein Dutzend Jahre lang von der jährlichen GSOEP-Umfrage (Deutsche Sozioökonomische Studie) verfolgt wurden Panel), wobei mehr als 900 mit einer Trennung endeten.
Durch die Anwendung eines maschinellen Lernansatzes (insbesondere Random Survival Forests) ermittelte das Verfahren selbstständig die Beziehung zwischen den verschiedenen in der Datenbank enthaltenen Faktoren. In diesem Fall wurden mehr als 40 Faktoren berücksichtigt, vom Alter bis zum Bildungsniveau, von der Gesundheit bis zu psychologischen Merkmalen: Die Masse der Rohdaten wurde in ML eingespeist, ohne dass präzise Hypothesen aufgestellt wurden, sondern lediglich der Zusammenbruch des Ereignisses als Ereignis von Interesse angegeben wurde Union, und der Algorithmus zeigte den Einfluss jedes in den Daten enthaltenen Faktors an. Die Variablen, die die größte Bedrohung für die Stabilität einer Gewerkschaft darstellen, wurden mit einer Genauigkeit von 70 % identifiziert (eine Vorhersagefähigkeit, die die 50 % übertrifft, die mit herkömmlichen Regressionsmethoden erreicht werden).
ML war nicht nur in der Lage, die Faktoren zu entdecken, die der Trennung von Paaren zugrunde liegen, sondern konnte dieses Wissen auch nutzen, um das Ende einer Ehe vorherzusagen, bevor es eintritt. Dies liegt auch daran, dass nicht alle verfügbaren Daten an einen Ad-hoc-Algorithmus übermittelt wurden, sondern die Hälfte dazu verwendet wurde, den Algorithmus selbst zu unterrichten, und die Gültigkeit der Ergebnisse mit der anderen Hälfte des Datensatzes überprüft wurde.
Die Ergebnisse der Analyse sind sehr interessant, vor allem weil die ML-Methodik in der Lage ist, die relative Bedeutung verschiedener Faktoren für die Trennung abzuwägen. Stattdessen haben Faktoren, die in früheren Studien besonders einflussreich waren, hier ihre Relevanz verloren, wie etwa Arbeitslosigkeit und das hohe Bildungs- und Einkommensniveau des Partners.
Die vier Hauptrisikofaktoren, die aus der Studie hervorgingen, sind in absteigender Reihenfolge aufgeführt: persönliche Zufriedenheit, Umfang der bezahlten Arbeit der Frau, einige Persönlichkeitsfaktoren und Alter.
Der stärkste Indikator für eine Trennung ist die persönliche Zufriedenheit: Wenn beide Partner unzufrieden sind, wird das Paar offensichtlich nicht von Dauer sein. Weniger offensichtlich ist, dass ein starker Rückgang der ehelichen Stabilität auftritt, wenn die Frau mit der Verbindung sehr zufrieden ist, der Mann jedoch weitaus weniger, während der umgekehrte Effekt weniger offensichtlich ist. Wenn die Frau viele Stunden außerhalb des Hauses arbeitet, ist das Risiko einer Trennung oder Scheidung höher, auch wenn der Mann stärker in die Hausarbeit eingebunden ist (dieses Ergebnis ist jedoch nichts Neues und hängt laut der vorhandenen Literatur von der größeren Entscheidungsfreiheit und Unabhängigkeit ab). der berufstätigen Frauen.
Was die Persönlichkeitsmerkmale betrifft, so sind eine hohe Extraversion bei Männern (klassisch verbunden mit einer höheren Untreue) und eine geringe Offenheit bei Frauen, die weniger anpassungsfähig an die Veränderungen sind, die das Zusammenleben mit sich bringt, die Merkmale, die stärker mit dem Ende eines Paares in Verbindung gebracht werden. Auch ein geringes Maß an Gewissenhaftigkeit beider Partner (verstanden als Organisationsfähigkeit im täglichen Leben und daher – wenn gering – als Unordnung und Unfähigkeit, Verpflichtungen einzuhalten) trägt nicht zum Zusammenbleiben bei. Aber auch ein zu hoher oder zu niedriger Grad an Neurotizismus kann ein Problem sein. Dieses Ergebnis kann als die Tatsache interpretiert werden, dass das Leiden unter übermäßiger Angst, Eifersucht, Schuldgefühlen, Sorgen oder Wut die Beziehung eindeutig erschwert.
Dies trifft vor allem auf Frauen zu, doch wer diese Art von Emotionen nicht verspürt, könnte bei seinen Partnern (in diesem Fall bei Männern) dazu führen, dass sie dieses Persönlichkeitsmerkmal als mangelndes Interesse interpretieren. Es konnte jedoch keine Persönlichkeitspaarung festgestellt werden, die stärker mit dem Abbruch der Beziehung verbunden ist. Wenn man schließlich das Alter berücksichtigt, neigen sehr junge Paare dazu, instabiler zu sein, aber bei Frauen nimmt die Stabilität in Beziehungen nach dem 40. Lebensjahr zu, während dies bei Männern nicht der Fall ist.
Die ML-Analyse ist nicht ohne Einschränkungen. In diesem Fall ist der Hauptgrund, dass er sich nur auf Deutschland bezieht und auch nur wenige Details zu den psychologischen Aspekten der beiden Partner enthält. Aus methodischer Sicht zeigt die Studie jedoch das große Potenzial von ML-Techniken in der demografischen und soziologischen Forschung im Allgemeinen und unterstreicht ihre Fähigkeit, eine große Anzahl prädiktiver Faktoren zu überwachen und zu analysieren, automatisch lineare oder nichtlineare Beziehungen zu finden, additive oder nichtadditive Beziehungen zwischen diesen Faktoren und dem interessierenden Ergebnis, mit größerer Präzision und Robustheit der Schätzungen gegenüber Kollinearität als häufig verwendete Methoden.
Zur Verfügung gestellt von der Bocconi-Universität