DeepMind veröffentlicht den Kern von AlphaGo und AlphaZero als Open Source

xguru · 2023-02-17T14:33:34+09:00

Befindet sich im nach Mctx (MCTS-in-JAX) benannten Repo Eine extrem schnelle Bibliothek, die den Monte Carlo Tree Search (MCTS)-Algorithmus nativ in JAX implementiert Ein Suchalgorithmus, der in rundenbasierten Spielen den besten Zug auswählt, indem er nach dem Muster „Auswahl → Erweiterung → Simulation → Aktualisierung der Knoten im Strategiebbaum“ vorgeht Die komplexeste Komponente von AlphaGo, und es ist äußerst wichtig, diese effizient zu machen Wird nicht nur für AlphaGo verwendet, sondern auch für AlphaZero (Go, Chess, Shogi) und MuZero (AlphaZero + Atari-Spiele)

Befindet sich im nach Mctx (MCTS-in-JAX) benannten Repo
Eine extrem schnelle Bibliothek, die den Monte Carlo Tree Search (MCTS)-Algorithmus nativ in JAX implementiert
- Ein Suchalgorithmus, der in rundenbasierten Spielen den besten Zug auswählt, indem er nach dem Muster „Auswahl → Erweiterung → Simulation → Aktualisierung der Knoten im Strategiebbaum“ vorgeht
Die komplexeste Komponente von AlphaGo, und es ist äußerst wichtig, diese effizient zu machen
Wird nicht nur für AlphaGo verwendet, sondern auch für AlphaZero (Go, Chess, Shogi) und MuZero (AlphaZero + Atari-Spiele)

1 Kommentare

xguru 2023-02-17

Diesen Tweet selbst habe ich auf HN gesehen: https://news.ycombinator.com/item?id=34801636
Tatsächlich ist dieses Repo schon seit etwa einem Jahr öffentlich, und es gibt auch Kommentare, die es als irreführenden Titel kritisieren, weil das nicht das komplette AlphaGo sei.
Außerdem heißt es, dass die ursprüngliche AlphaGo-Implementierung auf TensorFlow/TPU basiert und dies lediglich eine Neuimplementierung in JAX ist.

DeepMind veröffentlicht den Kern von AlphaGo und AlphaZero als Open Source

Verwandte Beiträge

1 Kommentare