22 Punkte von xguru 2023-03-30 | Noch keine Kommentare. | Auf WhatsApp teilen
  • Ein minimalistisches System zur Ausführung aktueller LLMs auf Nvidia-GPUs für Endverbraucher
  • Unterstützt mehrere LLMs (LLAMA, BLOOM, OPT) mit einer Größe von bis zu 170B
  • Unterstützung für verschiedene Arten von Nvidia-GPUs
  • Kleiner, benutzerfreundlicher Code in Python
  • Verwendet intern den GPTQ-Algorithmus für 3-Bit-Komprimierung, um den GPU-Speicherverbrauch zu minimieren

Noch keine Kommentare.

Noch keine Kommentare.