- Befindet sich im nach
Mctx (MCTS-in-JAX) benannten Repo
- Eine extrem schnelle Bibliothek, die den Monte Carlo Tree Search (MCTS)-Algorithmus nativ in JAX implementiert
- Ein Suchalgorithmus, der in rundenbasierten Spielen den besten Zug auswählt, indem er nach dem Muster „Auswahl → Erweiterung → Simulation → Aktualisierung der Knoten im Strategiebbaum“ vorgeht
- Die komplexeste Komponente von AlphaGo, und es ist äußerst wichtig, diese effizient zu machen
- Wird nicht nur für AlphaGo verwendet, sondern auch für AlphaZero (Go, Chess, Shogi) und MuZero (AlphaZero + Atari-Spiele)
1 Kommentare
Diesen Tweet selbst habe ich auf HN gesehen: https://news.ycombinator.com/item?id=34801636
Tatsächlich ist dieses Repo schon seit etwa einem Jahr öffentlich, und es gibt auch Kommentare, die es als irreführenden Titel kritisieren, weil das nicht das komplette AlphaGo sei.
Außerdem heißt es, dass die ursprüngliche AlphaGo-Implementierung auf TensorFlow/TPU basiert und dies lediglich eine Neuimplementierung in JAX ist.