4 Punkte von xguru 2023-03-09 | Noch keine Kommentare. | Auf WhatsApp teilen
  • Führt Metas LLaMA-Modell auf der CPU aus
  • Die Einrichtung ist fast identisch
  • Beim Test mit dem 7B-Modell werden zum Laden selbst bei 32 GiB RAM Swap/zram benötigt
  • Bei der eigentlichen Inferenz werden tatsächlich nur etwa weniger als 20 GiB RAM verwendet
  • Auf einem Ryzen 7900X kann das 7B-Modell mehrere Wörter pro Sekunde inferieren

Noch keine Kommentare.

Noch keine Kommentare.