LLaMA-Adapter V2: Ein Tool zum effizienten Fine-Tuning von LLaMA

xguru · 2023-05-03T10:18:01+09:00

Mit nur 1,2 Millionen trainierbaren Parametern kann LLaMA in nur 1 Stunde zu einem Instruction-Following- und Multimodal-Modell trainiert werden Alpaca benötigt 7B Parameter, 13G Speicherplatz und 3 Stunden, LLaMA-Adapter dagegen kommt mit 1.2M Parametern, 4.7M Speicherplatz und 1 Stunde aus

(github.com/ZrrSkywalker)

7 Punkte von xguru 2023-05-03 | 1 Kommentare | Auf WhatsApp teilen

Mit nur 1,2 Millionen trainierbaren Parametern kann LLaMA in nur 1 Stunde zu einem Instruction-Following- und Multimodal-Modell trainiert werden
Alpaca benötigt 7B Parameter, 13G Speicherplatz und 3 Stunden,
LLaMA-Adapter dagegen kommt mit 1.2M Parametern, 4.7M Speicherplatz und 1 Stunde aus

1 Kommentare

bytebrawlers 2023-05-03

Wurde dabei nicht ein PEFT-Verfahren ähnlich wie LoRA verwendet, und ist der wichtigste Punkt nicht vor allem, dass Visual Context unterstützt wird? Es gibt bereits so viele SFTs (Instruction Fine-Tuning) als PEFT-Ansatz für LLaMA, dass ...

LLaMA-Adapter V2: Ein Tool zum effizienten Fine-Tuning von LLaMA

Verwandte Beiträge

1 Kommentare