Wie treffen Menschen Entscheidungen, wenn der Ausgang ungewiss ist? Eine Möglichkeit wäre, den Erwartungswert jeder Option zu berechnen, indem man jeden möglichen Ergebnisbetrag mit seiner Wahrscheinlichkeit multipliziert und dann die Option mit dem höchsten Erwartungswert wählt. Während diese Strategie den erwarteten Gewinn maximieren würde, ist dies nicht das, was die Leute normalerweise tun. Insbesondere scheinen Menschen bei späteren Entscheidungen irrational von den Ergebnissen ihrer Entscheidungen in der Vergangenheit beeinflusst zu werden.
Forscher der Universität Tsukuba haben ein Modell („Dynamic Prospect Theory“) entwickelt und validiert, das das beliebteste Modell der Verhaltensökonomie zur Beschreibung der Entscheidungsfindung unter Unsicherheit – die Prospect-Theorie – und ein gut etabliertes Lernmodell aus der Neurowissenschaft integriert. Theorie des verstärkenden Lernens. Dieses Modell beschrieb die Entscheidungen, die Menschen und Affen angesichts von Risiken trafen, genauer als die Prospect-Theorie oder die Reinforcement-Learning-Theorie allein.
Konkret baten die Forscher 70 Personen, wiederholt zwischen zwei Lotterien zu wählen, bei denen sie mit einiger Wahrscheinlichkeit eine Belohnung gewinnen könnten. Die Lotterien unterschieden sich in der Höhe der Belohnung, der Wahrscheinlichkeit, sie zu erhalten, und der Höhe des damit verbundenen Risikos. Die Ergebnisse zeigten, dass sich die Teilnehmer unmittelbar nach dem Erleben eines Ergebnisses, das größer als der erwartete Wert der ausgewählten Option war, so verhielten, als ob die Wahrscheinlichkeit, in der nächsten Lotterie zu gewinnen, zunahm.
Der leitende Autor der Studie, Assistenzprofessor Hiroshi Yamada, sagt: „Dieses Verhalten ist überraschend, weil den Teilnehmern die Gewinnwahrscheinlichkeiten klar beschrieben wurden (die Teilnehmer mussten sie nicht aus Erfahrung lernen) und diese Wahrscheinlichkeiten auch völlig unabhängig von früheren Ergebnissen waren.“ Mithilfe ihres dynamischen Prospect-Theory-Modells konnten die Forscher feststellen, dass die Verhaltensänderung eher auf einer Änderung der Wahrnehmung von Wahrscheinlichkeiten als auf einer Änderung der Bewertung von Belohnungen beruht.
Yamada sagt außerdem: „Ein solches Lernen aus unerwarteten Ereignissen liegt der Theorie des verstärkenden Lernens zugrunde und ist ein bekannter Algorithmus, der auftritt, wenn Menschen die Belohnungen aus Erfahrung lernen müssen. Interessant ist, dass es auch dann auftritt, wenn Lernen nicht notwendig ist.“
In ähnlichen Experimenten mit Makakenaffen, deren Gehirne denen von Menschen sehr ähneln, wurden im Wesentlichen die gleichen Ergebnisse beobachtet. Die Forscher bemerkten, dass die Ähnlichkeit im Verhalten von Menschen und Affen in dieser Studie bemerkenswert sei.
Basierend auf den Ergebnissen dieser Forschung wird erwartet, dass die Untersuchung des Affengehirns zu einem Verständnis der Gehirnmechanismen führen wird, die an der Wahrnehmung von Belohnungen und Wahrscheinlichkeiten beteiligt sind, die wir alle nutzen, wenn wir riskante Entscheidungen sowie Freude treffen Wir spüren, wenn wir Erfolg haben.
Der Artikel wird in der Zeitschrift veröffentlicht Wissenschaftliche Fortschritte.
Mehr Informationen:
Agnieszka Tymula et al., Dynamische Aussichtstheorie: Im Spielverhalten von Affen und Menschen existieren zwei zentrale Entscheidungstheorien nebeneinander, Wissenschaftliche Fortschritte (2023). DOI: 10.1126/sciadv.ade7972