Alpaca-LoRA: Low-Rank-LLaMA-Instruct-Tuning

xguru · 2023-03-22T10:17:02+09:00

Mit Low-Rank Adaptation ausprobieren, LLaMA auf eigener Hardware per Instruction-Tuning anzupassen Ein Modell, das sogar auf einem Raspberry Pi laufen kann und dabei eine ähnliche Qualität wie text-davinci-003 bietet Der Trainingscode kann auf einer einzelnen RTX 4090 in weniger als 5 Stunden ausgeführt werden Verwendet Hugging Faces PEFT (Parameter-Efficient Fine-Tuning) und Tim Dettmers bitsandbytes für günstiges und effizientes Fine-Tuning

(github.com/tloen)

19 Punkte von xguru 2023-03-22 | Noch keine Kommentare. | Auf WhatsApp teilen

Mit Low-Rank Adaptation ausprobieren, LLaMA auf eigener Hardware per Instruction-Tuning anzupassen
Ein Modell, das sogar auf einem Raspberry Pi laufen kann und dabei eine ähnliche Qualität wie text-davinci-003 bietet
Der Trainingscode kann auf einer einzelnen RTX 4090 in weniger als 5 Stunden ausgeführt werden
Verwendet Hugging Faces PEFT (Parameter-Efficient Fine-Tuning) und Tim Dettmers bitsandbytes für günstiges und effizientes Fine-Tuning

Alpaca-LoRA: Low-Rank-LLaMA-Instruct-Tuning

Verwandte Beiträge

Noch keine Kommentare.