Lit-LLaMA - Open-Source-LLaMA-Implementierung auf Basis von nanoGPT
(github.com/Lightning-AI)- Open Source, vollständig separat entwickelt auf Basis von nanoGPT mit Apache-2.0-Lizenz, statt des unter GPL lizenzierten LLaMA-Codes
- Einfach, da als einzelne Datei ohne Boilerplate implementiert, und numerisch identisch mit dem bestehenden Modell
- Unterstützt FlashAttention, Quantisierung, LoRA-Finetuning und Pretraining
- Optimiert für die Ausführung auf Consumer-Hardware
1 Kommentare
nanoGPT ist Code, mit dem Andrej Karpathy, der AI-Chef bei Tesla war, minGPT neu geschrieben hat.
nanoGPT - Open Source, um mittelgroße GPTs am schnellsten zu trainieren/feinzutunen
FlashAttention