Alpaca: Ein leistungsstarkes Open-Source-Instruction-Following-Modell auf GPT-3.5-Niveau

xguru · 2023-03-14T11:21:01+09:00

Das Stanford CRFM hat Metas LLaMA 7B mit 52K Instruction-Following-Daten feinabgestimmt Funktioniert ähnlich wie OpenAIs GPT-3.5 (text-davinci-003), ist aber deutlich kleiner und günstiger Das Trainingsrezept und die Daten werden veröffentlicht; die Modellgewichte sollen später ebenfalls freigegeben werden Veröffentlichung nur zu Forschungszwecken; kommerzielle Nutzung ist untersagt Das Fine-Tuning dauerte auf 8 A100 mit 80 GB 3 Stunden und ist in der Cloud für unter etwa 100 US-Dollar möglich

(crfm.stanford.edu)

19 Punkte von xguru 2023-03-14 | 1 Kommentare | Auf WhatsApp teilen

Das Stanford CRFM hat Metas LLaMA 7B mit 52K Instruction-Following-Daten feinabgestimmt
Funktioniert ähnlich wie OpenAIs GPT-3.5 (text-davinci-003), ist aber deutlich kleiner und günstiger
Das Trainingsrezept und die Daten werden veröffentlicht; die Modellgewichte sollen später ebenfalls freigegeben werden
Veröffentlichung nur zu Forschungszwecken; kommerzielle Nutzung ist untersagt
Das Fine-Tuning dauerte auf 8 A100 mit 80 GB 3 Stunden und ist in der Cloud für unter etwa 100 US-Dollar möglich

1 Kommentare

xguru 2023-03-14

Repo: https://github.com/tatsu-lab/stanford_alpaca
Web-Demo: https://crfm.stanford.edu/alpaca/

Die Veröffentlichung von LLaMA sorgt wirklich für einen Stable Diffusion Moment. Die Entwicklung verläuft unglaublich schnell.

Alpaca: Ein leistungsstarkes Open-Source-Instruction-Following-Modell auf GPT-3.5-Niveau

Verwandte Beiträge

1 Kommentare