LLaMA-rs – LLaMA in Rust implementiert

xguru · 2023-03-17T14:14:34+09:00

Ein Projekt, das llama.cpp nach Rust portiert Unterstützt Modelle in f16 oder 4-Bit-quantisierter Version Nutzt wie das Original unverändert die Tensor-Bibliothek ggml und erreicht dadurch die gleiche Performance wie das Original

(github.com/setzer22)

10 Punkte von xguru 2023-03-17 | 1 Kommentare | Auf WhatsApp teilen

Ein Projekt, das llama.cpp nach Rust portiert
Unterstützt Modelle in f16 oder 4-Bit-quantisierter Version
Nutzt wie das Original unverändert die Tensor-Bibliothek ggml und erreicht dadurch die gleiche Performance wie das Original

1 Kommentare

xguru 2023-03-17

Es gibt auch eine Rust-Implementierung von LLaMA: RLLaMA - Rust+OpenCL+AVX2.

llama.cpp - Inferenz des LLaMA-Modells von Facebook in reinem C/C++

LLaMA-rs – LLaMA in Rust implementiert

Verwandte Beiträge

1 Kommentare