nano-llama31 – Llama-3.1-Version im nanoGPT-Stil
(github.com/karpathy)- Eine von Andrej Karpathy implementierte Llama-3.1-Version im nanoGPT-Stil
- Eine minimale, abhängigkeitfreie Implementierung der Llama-3.1-Architektur, mit der sich Training, Fine-Tuning und Inferenz sehr einfach durchführen lassen
- Weniger Abhängigkeiten und kleinerer Codeumfang als die Implementierungen von Meta und HuggingFace
- Der Fokus liegt derzeit auf dem 8B-Basismodell von Llama 3.1
- WIP: noch in Entwicklung und noch nicht fertig
Noch keine Kommentare.