- DeepMind hat den Scalable Instructable Multiworld Agent (SIMA) vorgestellt
-
- Google DeepMind hat eine lange Geschichte im Bereich KI und Games – von Atari-Spielen bis zum AlphaStar-System, das StarCraft II auf dem Niveau menschlicher Großmeister spielt
- SIMA ist ein allgemeiner KI-Agent für 3D-virtuelle Umgebungen und kann in verschiedenen Videospielumgebungen Aufgaben anhand natürlicher Sprachanweisungen ausführen
- Diese Forschung zielt auf den Wechsel weg vom Fokus auf einzelne Spiele hin zu einem allgemeinen, anweisbaren KI-Agenten für Gameplay
- Das System wurde in Zusammenarbeit mit verschiedenen Spieleentwicklern über mehrere Videospiele hinweg trainiert
- Erstmals wird gezeigt, dass ein KI-Agent umfangreiche Spielwelten verstehen und darin Aufgaben gemäß natürlichsprachlichen Anweisungen ausführen kann
Lernen in Videospielen
- SIMA wurde in 9 verschiedenen Videospielen trainiert und getestet, darunter Hello Games’ No Man’s Sky und Tuxedo Labs’ Teardown
- Um das System verschiedenen Umgebungen auszusetzen, wurden in Zusammenarbeit mit Spieleentwicklern Partnerschaften mit 8 Spielestudios geschlossen
- SIMA erlernte vielfältige Fähigkeiten – von einfacher Navigation und Menünutzung bis hin zu Rohstoffabbau, Raumschiffsteuerung und Helmherstellung
- Es kam außerdem in 4 Forschungsumgebungen zum Einsatz, darunter Construction Lab, eine neue mit Unity aufgebaute Umgebung
SIMA: ein vielseitiger KI-Agent
- SIMA ist ein KI-Agent, der verschiedene Umgebungen wahrnehmen und verstehen kann und anschließend Handlungen ausführt, um vorgegebene Ziele zu erreichen
- Enthält ein Modell für präzises Bild-Sprach-Mapping sowie ein Videomodell, das vorhersagt, was als Nächstes auf dem Bildschirm passiert
- Benötigt keinen Zugriff auf den Spiele-Quellcode oder spezielle APIs, sondern nur Bildschirmbilder und einfache natürlichsprachliche Anweisungen vom Nutzer
- SIMA steuert den Hauptcharakter im Spiel per Tastatur- und Mausausgabe und führt so diese Anweisungen aus
Generalisierung in Spielen und anderen Umgebungen
- Ein über mehrere Spiele trainierter Agent zeigte bessere Leistung als ein Agent, der nur auf ein einzelnes Spiel trainiert wurde
- Es ist weitere Forschung nötig, damit das System nicht nur in trainierten, sondern auch in unbekannten Umgebungen Leistung auf menschlichem Niveau erbringen kann
- SIMAs Leistung hängt von Sprache ab; ohne Sprachtraining oder Anweisungen handelt es angemessen, aber ohne Ziel
Fortschritte in der KI-Agentenforschung
- Die Ergebnisse von SIMA zeigen das Potenzial für die Entwicklung allgemeiner sprachbasierter KI-Agenten
- Es handelt sich um Forschung in einem frühen Stadium; erwartet wird eine weitere Weiterentwicklung von SIMA durch mehr Trainingsumgebungen und leistungsfähigere Modelle
- Langfristiges Ziel ist es, allgemeine KI-Systeme und Agenten zu bauen, die Menschen nützlich sind, vielfältige Aufgaben online und in der realen Welt verstehen und sicher ausführen können
Meinung von GN⁺
- SIMA ist eine wichtige Forschungsarbeit, die zeigt, dass KI in der Lage ist, Anweisungen in verschiedenen Umgebungen menschenähnlich zu verstehen und danach zu handeln
- Solche Forschung könnte den Weg in eine Zukunft öffnen, in der KI über die Ausführung einfacher Aufgaben hinaus auch komplexe strategische Planung und Multitasking bewältigt
- Allerdings sind noch viel Forschung und Weiterentwicklung nötig, bevor KI Leistung auf menschlichem Niveau erbringen kann
- Es braucht eine Diskussion darüber, wie diese Technologie zur Lösung realer Probleme eingesetzt werden kann und welche potenziellen Grenzen die Generalisierungsfähigkeit von KI hat
- Ein anderes KI-Projekt mit ähnlicher Funktion ist OpenAI Gym, eine KI-Plattform, die in verschiedenen Videospielen lernen kann
1 Kommentare
Hacker-News-Kommentare