Beyond A*: Bessere Planung mit Transformern
- Transformer-Modelle haben in vielen Anwendungsbereichen große Fortschritte erzielt, bleiben bei der Lösung komplexer Entscheidungsaufgaben jedoch hinter traditionellen symbolischen Planungsmethoden zurück.
- Forschende zeigen eine Methode, Transformer für die Lösung komplexer Planungsaufgaben zu trainieren, und entwickeln das Modell Searchformer, das zuvor ungesehene Sokoban-Rätsel in 93,7 % der Fälle optimal löst und dabei bis zu 26,8 % weniger Suchschritte als die klassische A*-Suche benötigt.
- Searchformer ist ein Encoder-Decoder-Transformer-Modell, das darauf trainiert wurde, das Suchverhalten von A* vorherzusagen, und per Expert Iteration feinabgestimmt wurde, um optimale Pläne mit weniger Suchschritten als A* zu erzeugen.
Trainingsmethode und Leistung
- In der Trainingsmethode wird das Suchverhalten von A* als Token-Sequenz dargestellt, die angibt, wann Zustände im Suchbaum der symbolischen Planung hinzugefügt und entfernt werden.
- In einer Ablationsstudie zur Labyrinthsuche übertrifft Searchformer ein Basismodell, das optimale Pläne direkt vorhersagt, deutlich, obwohl das Modell 5- bis 10-mal kleiner ist und der Trainingsdatensatz 10-mal kleiner ausfällt.
- Die Forschenden zeigen, dass Searchformer bei größeren und komplexeren Entscheidungsaufgaben wie Sokoban wirksam ist, sowohl beim Anteil gelöster Aufgaben als auch bei der Verkürzung des Suchverhaltens.
Meinung von GN⁺
- Diese Studie zeigt neue Einsatzmöglichkeiten von Transformer-Modellen im Bereich der künstlichen Intelligenz. Indem sie für die Lösung komplexer Entscheidungsaufgaben einen effizienteren Ansatz als bestehende symbolische Methoden aufzeigt, markiert sie einen wichtigen Fortschritt für die Erweiterung des Anwendungsspektrums von KI.
- Das Searchformer-Modell demonstriert schnellere und effizientere Problemlösungsfähigkeiten bei geringerem Ressourceneinsatz. Das kann insbesondere bei der Implementierung von KI in ressourcenbeschränkten Umgebungen ein großer Vorteil sein.
- Die Studie deutet darauf hin, dass Fortschritte in der KI nicht zwangsläufig nur von mehr Daten und größeren Modellen abhängen, sondern auch durch intelligentere Methoden und verbesserte Algorithmen erreicht werden können. Das ist ein sehr interessanter und nützlicher Ansatz im Hinblick auf Nachhaltigkeit und Effizienz in der KI-Forschung.
1 Kommentare
Hacker-News-Kommentare