SlowLlama - Feinabstimmung von Llama2-70b und CodeLlama auf M1/M2 ohne Quantisierung

xguru · 2023-10-09T10:32:01+09:00

Feinabstimmung von Modellen wie Llama2-70B auf Apple M1/M2 und Consumer-nVidia-GPUs Anstatt Quantisierung zu verwenden, werden Teile des Modells sowohl im Forward- als auch im Backward-Pass auf SSD oder den Hauptspeicher ausgelagert Die aktuelle Version beschränkt Aktualisierungen mithilfe von LoRA auf einen kleineren Parametersatz Die erste Version unterstützte auch vollständige Feinabstimmung, das wurde inzwischen aber entfernt

(github.com/okuvshynov)

9 Punkte von xguru 2023-10-09 | Noch keine Kommentare. | Auf WhatsApp teilen

Feinabstimmung von Modellen wie Llama2-70B auf Apple M1/M2 und Consumer-nVidia-GPUs
Anstatt Quantisierung zu verwenden, werden Teile des Modells sowohl im Forward- als auch im Backward-Pass auf SSD oder den Hauptspeicher ausgelagert
Die aktuelle Version beschränkt Aktualisierungen mithilfe von LoRA auf einen kleineren Parametersatz
- Die erste Version unterstützte auch vollständige Feinabstimmung, das wurde inzwischen aber entfernt

SlowLlama - Feinabstimmung von Llama2-70b und CodeLlama auf M1/M2 ohne Quantisierung

Verwandte Beiträge

Noch keine Kommentare.