MiniLLM – Ausführung von LLMs auf einer persönlichen GPU

xguru · 2023-03-30T10:45:01+09:00

Ein minimalistisches System zur Ausführung aktueller LLMs auf Nvidia-GPUs für Endverbraucher Unterstützt mehrere LLMs (LLAMA, BLOOM, OPT) mit einer Größe von bis zu 170B Unterstützung für verschiedene Arten von Nvidia-GPUs Kleiner, benutzerfreundlicher Code in Python Verwendet intern den GPTQ-Algorithmus für 3-Bit-Komprimierung, um den GPU-Speicherverbrauch zu minimieren

(github.com/kuleshov)

22 Punkte von xguru 2023-03-30 | Noch keine Kommentare. | Auf WhatsApp teilen

Ein minimalistisches System zur Ausführung aktueller LLMs auf Nvidia-GPUs für Endverbraucher
Unterstützt mehrere LLMs (LLAMA, BLOOM, OPT) mit einer Größe von bis zu 170B
Unterstützung für verschiedene Arten von Nvidia-GPUs
Kleiner, benutzerfreundlicher Code in Python
Verwendet intern den GPTQ-Algorithmus für 3-Bit-Komprimierung, um den GPU-Speicherverbrauch zu minimieren

MiniLLM – Ausführung von LLMs auf einer persönlichen GPU

Verwandte Beiträge

Noch keine Kommentare.