LLaMA-CPU - Fork zum Ausführen von LLaMA auf der CPU

xguru · 2023-03-09T11:20:01+09:00

Führt Metas LLaMA-Modell auf der CPU aus Die Einrichtung ist fast identisch Beim Test mit dem 7B-Modell werden zum Laden selbst bei 32 GiB RAM Swap/zram benötigt Bei der eigentlichen Inferenz werden tatsächlich nur etwa weniger als 20 GiB RAM verwendet Auf einem Ryzen 7900X kann das 7B-Modell mehrere Wörter pro Sekunde inferieren

(github.com/markasoftware)

4 Punkte von xguru 2023-03-09 | Noch keine Kommentare. | Auf WhatsApp teilen

Führt Metas LLaMA-Modell auf der CPU aus
Die Einrichtung ist fast identisch
Beim Test mit dem 7B-Modell werden zum Laden selbst bei 32 GiB RAM Swap/zram benötigt
Bei der eigentlichen Inferenz werden tatsächlich nur etwa weniger als 20 GiB RAM verwendet
Auf einem Ryzen 7900X kann das 7B-Modell mehrere Wörter pro Sekunde inferieren

LLaMA-CPU - Fork zum Ausführen von LLaMA auf der CPU

Verwandte Beiträge

Noch keine Kommentare.