Neues KI-Modell kann die menschliche Lebensspanne vorhersagen, sagen Forscher. Sie wollen sicherstellen, dass es für einen guten Zweck genutzt wird

Forscher haben ein Tool für künstliche Intelligenz entwickelt, das Abfolgen von Lebensereignissen – wie Krankengeschichte, Bildung, Beruf und Einkommen – nutzt, um alles von der Persönlichkeit einer Person bis hin zu ihrer Sterblichkeit vorherzusagen.

Das neue Tool life2vec basiert auf Transformer-Modellen, die Large Language Models (LLMs) wie ChatGPT unterstützen, und wird anhand eines Datensatzes trainiert, der aus der gesamten dänischen Bevölkerung – 6 Millionen Menschen – stammt. Der Datensatz wurde nur den Forschern von der dänischen Regierung zur Verfügung gestellt.

Das Tool, das die Forscher auf der Grundlage dieses komplexen Datensatzes entwickelt haben, ist in der Lage, die Zukunft, einschließlich der Lebensspanne von Einzelpersonen, mit einer Genauigkeit vorherzusagen, die über modernste Modelle hinausgeht. Aber trotz ihrer Vorhersagekraft sagt das Team hinter der Forschung, dass sie am besten als Grundlage für zukünftige Arbeiten und nicht als Selbstzweck genutzt werden sollte.

„Obwohl wir Vorhersagen verwenden, um zu bewerten, wie gut diese Modelle sind, sollte das Tool nicht für Vorhersagen an realen Menschen verwendet werden“, sagt Tina Eliassi-Rad, Professorin für Informatik und erste Präsidentin von Joseph E. Aoun Nordöstliche Universität. „Es handelt sich um ein Vorhersagemodell, das auf einem bestimmten Datensatz einer bestimmten Bevölkerung basiert.“

Eliassi-Rad brachte ihre KI-Ethik-Expertise in das Projekt ein. „Mit diesen Tools können Sie Ihre Gesellschaft auf eine andere Art und Weise betrachten: die Richtlinien, die Sie haben, die Regeln und Vorschriften, die Sie haben“, sagt sie. „Man kann es sich wie einen Scan dessen vorstellen, was vor Ort passiert.“

Durch die Einbeziehung von Sozialwissenschaftlern in den Prozess der Entwicklung dieses Tools hofft das Team, einen menschenzentrierten Ansatz für die KI-Entwicklung zu schaffen, der den Menschen trotz der riesigen Datenmenge, auf deren Grundlage das Tool trainiert wurde, nicht aus den Augen verliert.

„Dieses Modell bietet eine viel umfassendere Darstellung der Welt, wie sie von Menschen gelebt wird, als viele andere Modelle“, sagt Sune Lehmann, Autor von das Papierdas kürzlich in veröffentlicht wurde Naturinformatik. A Forschungsbriefing zum Thema wird in derselben Zeitschriftenausgabe vorgestellt.

Das Herzstück von life2vec ist der riesige Datensatz, den die Forscher zum Trainieren ihres Modells verwendeten. Die Daten werden von Statistics Denmark, der zentralen Behörde für dänische Statistik, gespeichert und sind, obwohl sie streng reguliert sind, für einige Mitglieder der Öffentlichkeit, darunter auch Forscher, zugänglich. Der Grund dafür, dass es so streng kontrolliert wird, ist, dass es ein detailliertes Register aller dänischen Bürger enthält.

Die vielen Ereignisse und Elemente, die ein Leben ausmachen und in den Daten dargelegt werden, von Gesundheitsfaktoren über Bildung bis hin zum Einkommen. Die Forscher verwendeten diese Daten, um lange Muster wiederkehrender Lebensereignisse zu erstellen, die sie in ihr Modell einfließen ließen. Dabei nutzten sie den Transformer-Modell-Ansatz, der zum Training von LLMs in der Sprache verwendet wird, und passten ihn an ein menschliches Leben an, das als Abfolge von Ereignissen dargestellt wird.

„In gewisser Weise kann man sich die gesamte Geschichte eines menschlichen Lebens auch als einen riesigen langen Satz der vielen Dinge vorstellen, die einem Menschen passieren können“, sagt Lehmann, Professor für Netzwerke und Komplexitätswissenschaft an der DTU Compute, Technical Universität Dänemark und zuvor Postdoktorand an der Northeastern.

Das Modell nutzt die Informationen, die es aus der Beobachtung von Millionen von Lebensereignissequenzen lernt, um sogenannte Vektordarstellungen in Einbettungsräumen zu erstellen, in denen es beginnt, Lebensereignisse wie Einkommen, Bildung oder Gesundheitsfaktoren zu kategorisieren und Verbindungen zwischen ihnen herzustellen. Diese Einbettungsräume dienen als Grundlage für die Vorhersagen, die das Modell letztendlich trifft.

Eines der von den Forschern vorhergesagten Lebensereignisse war die Sterbewahrscheinlichkeit einer Person.

„Wenn wir uns den Raum vorstellen, den das Modell für Vorhersagen nutzt, sieht er aus wie ein langer Zylinder, der von niedriger Sterbewahrscheinlichkeit zu hoher Sterbewahrscheinlichkeit führt“, sagt Lehmann. „Dann können wir zeigen, dass am Ende, wo die Todeswahrscheinlichkeit hoch ist, viele dieser Menschen tatsächlich gestorben sind, und am Ende, wo die Sterbewahrscheinlichkeit gering ist, die Todesursachen etwas sind, das wir nicht vorhersagen konnten, wie zum Beispiel ein Auto.“ Unfälle.“

Der Artikel zeigt auch, wie das Modell in der Lage ist, individuelle Antworten auf einen Standard-Persönlichkeitsfragebogen vorherzusagen, insbesondere wenn es um Extrovertiertheit geht.

Eliassi-Rad und Lehmann weisen darauf hin, dass das Modell zwar sehr genaue Vorhersagen macht, diese jedoch auf Korrelationen, hochspezifischen kulturellen und gesellschaftlichen Kontexten und den Arten von Verzerrungen basieren, die in jedem Datensatz vorhanden sind.

„Diese Art von Werkzeug ist wie ein Observatorium der Gesellschaft – und nicht aller Gesellschaften“, sagt Eliassi-Rad. „Diese Studie wurde in Dänemark durchgeführt, und Dänemark hat seine eigene Kultur, seine eigenen Gesetze und seine eigenen gesellschaftlichen Regeln. Ob dies in Amerika möglich ist, ist eine andere Geschichte.“

Angesichts all dieser Vorbehalte betrachten Eliassi-Rad und Lehmann ihr Vorhersagemodell weniger als ein Endprodukt, sondern eher als den Beginn eines Gesprächs. Lehmann sagt, dass große Technologieunternehmen diese Art von Vorhersagealgorithmen wahrscheinlich schon seit Jahren in verschlossenen Räumen entwickeln. Er hofft, dass diese Arbeit dazu beitragen kann, ein offeneres, öffentliches Verständnis dafür zu schaffen, wie diese Tools funktionieren, wozu sie fähig sind und wie sie verwendet werden sollten und wie nicht.

Mehr Informationen:
Germans Savcisens et al., Verwendung von Abfolgen von Lebensereignissen zur Vorhersage menschlicher Leben, Naturinformatik (2023). DOI: 10.1038/s43588-023-00573-5

Eine transformatorische Methode, die menschliche Leben anhand von Abfolgen von Lebensereignissen vorhersagt, Naturinformatik (2023). DOI: 10.1038/s43588-023-00586-0

Bereitgestellt von der Northeastern University

Diese Geschichte wurde mit freundlicher Genehmigung von Northeastern Global News erneut veröffentlicht news.northeastern.edu.

ph-tech