Während die künstliche Intelligenz im Schach schon vor langer Zeit die menschlichen Fähigkeiten übertroffen hat und in jüngerer Zeit Go – und nicht zu vergessen Doom – stellen andere komplexere Brettspiele immer noch eine Herausforderung für Computersysteme dar. Bis vor kurzem waren Stratego und Diplomacy zwei dieser Spiele, aber jetzt ist die KI bei ersterem gut und bei letzterem halbwegs menschlich geworden.
Oberflächlich betrachtet könnte man denken, dass dies nur daran liegt, dass diese Spiele ein gewisses Maß an langfristiger Planung und Strategie erfordern. Aber das gilt auch für Go und Schach, nur auf eine andere Art und Weise.
Der entscheidende Unterschied besteht eigentlich darin, dass Stratego und Diplomacy auf Strategie basierende Spiele sind unvollkommene Informationen. Bei Schach und Go können Sie jede Figur auf dem Brett sehen. Stratego verbirgt die Identität von Figuren, bis sie von einer anderen Figur getroffen werden, und Diplomatie dreht sich hauptsächlich darum, Vereinbarungen, Allianzen und natürlich Vendettas zu schließen, die geheim gehalten werden, aber den Kern des Spiels ausmachen. Bei keinem ehrlichen Schachspiel kommt ein Dritter herein, um den Läufer Ihres Gegners mit einem blauen Turm zu beschützen.
Beide Spiele erfordern keine grobe Berechnung von Wegen zum Sieg, sondern Soft Skills wie das Erraten, was der Gegner denkt und was der Computer denkt, und Bewegungen, die diese Annahmen berücksichtigen und hoffentlich durcheinanderbringen. Mit anderen Worten, es muss bluffen und einen anderen Spieler von etwas überzeugen, nicht nur mit den bestmöglichen Zügen überwältigen.
Das Stratego-Spielmodell von DeepMind, heißt DeepNash, nach dem berühmten Gleichgewicht. Es konzentriert sich weniger auf clevere Züge und mehr auf Spielzüge, die nicht ausgenutzt oder vorhergesagt werden können. In einigen Fällen kann dies gewagt sein, wie zum Beispiel in einem Spiel, das das Team gegen einen menschlichen Spieler beobachtet hat, bei dem die KI mehrere hochrangige Figuren geopfert hat, wodurch sie einen materiellen Nachteil hatte – aber es war alles ein kalkuliertes Risiko, die großen Geschütze des anderen Spielers herauszuholen , also könnte es um diese herum strategisieren. (Es gewann.)
DeepNash ist gut genug, um andere Stratego-Systeme fast jedes Mal zu schlagen, und in 84 % der Fälle gegen erfahrene Menschen. Da die Algorithmen, die in Go und Schach gut funktionieren, hier nicht gut funktionieren, haben sie eine neue algorithmische Methode namens Regularized Nash Dynamics erfunden – aber Sie müssen es tun die Zeitung lesen wenn du es tiefer verstehen willst. In der Zwischenzeit hier eine kommentierte Partie:
Auf der Seite der Diplomatie haben wir eine KI namens Cicero (ah, Hybris!) von Meta und CSAIL das es schafft, das Spiel auf menschlicher Ebene zu spielen – und wenn das nach Verdammung mit schwachem Lob klingt, denken Sie daran, dass Diplomatie für die meisten schwierig ist Menschen auf menschlicher Ebene zu spielen. Das Maß an Intrigen, Hinterlist, falschen Versprechungen und allgemeinen machiavellistischen Eskapaden, die die Leute im Spiel anstellen, ist so groß, dass es von vielen freundlichen Spielgruppen verboten wird. Ist ein Computer wirklich zu solchen Spielereien fähig?
Scheint so, und die Fortschritte, die dies ermöglichen, sind interessant. Schließlich ist der interessante Teil von Diplomacy nicht die Weltkarte und Teile, die ziemlich einfach zu lesen und zu bewerten sind, sondern das Potenzial für Pläne, die in diesen Arrangements verborgen sind. Wird Venedig an zwei Fronten bedroht, oder lockt es die Westfront durch eine lang erwogene Einfassung in eine Umfassungszone? Volte-Gesicht?
Nicht nur das, sondern um an den Intrigen teilzunehmen, muss man mit anderen Spielern sprechen (oder online chatten) und sie von Ihrer Aufrichtigkeit und Absicht überzeugen. Dies dauert mehr als CPU-Zyklen!
So funktioniert Cicero:
- Machen Sie anhand des Board-Status und des aktuellen Dialogs eine erste Vorhersage darüber, was jeder tun wird.
- Verfeinern Sie diese Vorhersage mithilfe von Planung und verwenden Sie diese Vorhersagen dann, um eine Absicht für sich selbst und seinen Partner zu formulieren.
- Generieren Sie mehrere Kandidatennachrichten basierend auf dem Zustand des Boards, dem Dialog und seinen Absichten.
- Filtern Sie die Kandidatenbotschaft, um Unsinn zu reduzieren, den Wert zu maximieren und sicherzustellen, dass sie mit unseren Absichten übereinstimmt.
Dann plädieren Sie für Ihren Fall und hoffen Sie, dass der andere Spieler nicht Ihren Tod plant.
Als Cicero auf webDiplomacy.net losgelassen wurde, spielte er ziemlich gut gegen seine Gegner, belegte den 2. Platz von 19 in einer Liga und übertraf im Allgemeinen andere.
Es ist noch sehr viel Arbeit in Arbeit – es kann den Überblick darüber verlieren, was es zu anderen gesagt hat, oder andere Fehler machen, die Menschen wahrscheinlich nicht machen würden – aber es ist ziemlich bemerkenswert, dass es überhaupt wettbewerbsfähig sein kann.