nano-llama31 – Llama-3.1-Version im nanoGPT-Stil

xguru · 2024-08-08T10:02:02+09:00

Eine von Andrej Karpathy implementierte Llama-3.1-Version im nanoGPT-Stil Eine minimale, abhängigkeitfreie Implementierung der Llama-3.1-Architektur, mit der sich Training, Fine-Tuning und Inferenz sehr einfach durchführen lassen Weniger Abhängigkeiten und kleinerer Codeumfang als die Implementierungen von Meta und HuggingFace Der Fokus liegt derzeit auf dem 8B-Basismodell von Llama 3.1 WIP: noch in Entwicklung und noch nicht fertig

(github.com/karpathy)

9 Punkte von xguru 2024-08-08 | Noch keine Kommentare. | Auf WhatsApp teilen

Eine von Andrej Karpathy implementierte Llama-3.1-Version im nanoGPT-Stil
Eine minimale, abhängigkeitfreie Implementierung der Llama-3.1-Architektur, mit der sich Training, Fine-Tuning und Inferenz sehr einfach durchführen lassen
- Weniger Abhängigkeiten und kleinerer Codeumfang als die Implementierungen von Meta und HuggingFace
Der Fokus liegt derzeit auf dem 8B-Basismodell von Llama 3.1
WIP: noch in Entwicklung und noch nicht fertig

nano-llama31 – Llama-3.1-Version im nanoGPT-Stil

Verwandte Beiträge

Noch keine Kommentare.