Letzte Woche kündigte Google DeepMind Genie 2 an, ein neues Videomodell, das plausible, konsistente und spielbare 3D-Umgebungen basierend auf einem Eingabeaufforderungsbild generiert.
DeepMind behauptet, dass Genie 2 über eine Reihe neuer und aufregender Funktionen verfügt, die die Beleuchtung und Reflexionen verbessern und sogar Videos aus realen Bildern generieren können. Innerhalb dieser generierten Welten kann das Modell auch animierte Charaktere erstellen, die zu Trainingszwecken als verkörperte Agenten fungieren können. Die Charaktere können mit der Welt interagieren, indem sie beispielsweise Luftballons platzen lassen, Türen öffnen und sich sogar mit nicht spielbaren Charakteren beschäftigen.
Das DeepMind-Team scheint hoffnungsvoll zu sein dass diese KI-generierten Videospiele ein hilfreicher Schritt bei der Ausbildung von Agenten sein werden: „Genie 2 zeigt das Potenzial grundlegender Weltmodelle für die Schaffung vielfältiger 3D-Umgebungen und die Beschleunigung der Agentenforschung“, schrieben sie kürzlich in einem Beitrag. Videospiele sind ein hilfreiches Werkzeug in der KI-Forschung. Sie sind interaktiv und bieten eine einzigartige Mischung aus Herausforderungen. Sie sind auch sichere Spielplätze zum Trainieren, Testen und Messen von Wirkstoffen, die möglicherweise in Produkten landen, die in der realen Welt verwendet werden.