nanoGPT – Open Source zum schnellsten Trainieren/Feintunen mittelgroßer GPTs
(github.com/karpathy)- Code, in dem Andrej Karpathy, früherer Head of AI bei Tesla, minGPT neu geschrieben hat
- Ziel ist es, gut lesbaren und unkomplizierten Code zu schreiben
train.pymit rund 300 Zeilenmodel.pymit rund 300 Zeilen
- Arbeitet daran, GPT-2 auf dem OpenWebText-Datensatz zu reproduzieren
Noch keine Kommentare.