LLaMA-rs – LLaMA in Rust implementiert
(github.com/setzer22)- Ein Projekt, das
llama.cppnach Rust portiert - Unterstützt Modelle in f16 oder 4-Bit-quantisierter Version
- Nutzt wie das Original unverändert die Tensor-Bibliothek ggml und erreicht dadurch die gleiche Performance wie das Original
1 Kommentare
Es gibt auch eine Rust-Implementierung von LLaMA: RLLaMA - Rust+OpenCL+AVX2.
llama.cpp - Inferenz des LLaMA-Modells von Facebook in reinem C/C++