- Dieses Projekt teilt Ergebnisse dazu, wie das Modell Deepseek R1 Distill 8B Q40 auf Raspberry Pi 5 8GB-Geräten ausgeführt werden kann.
- Die Leistung des Modells wurde mithilfe mehrerer Raspberry Pi bewertet und die Inferenz gemessen.
- Bewertungs- und Inferenzergebnisse
- 2 x Raspberry Pi 5 8GB
- Bewertung: 7,70 Token pro Sekunde
- Inferenz: 3,54 Token pro Sekunde
- 4 x Raspberry Pi 5 8GB
- Bewertung: 11,68 Token pro Sekunde
- Inferenz: 6,43 Token pro Sekunde
- Weitere Informationen
- Der Test wurde in einer abgeschotteten Netzwerkumgebung durchgeführt.
- Die Leistung in einer Cluster-Umgebung mit mehreren Geräten wurde überprüft.
1 Kommentare
Hacker-News-Kommentar
brew install llmoderpipx install llmoderuv tool install llmllm install llm-mlxllm mlx download-model mlx-community/DeepSeek-R1-Distill-Llama-8Bllm -m mlx-community/DeepSeek-R1-Distill-Llama-8B 'poem about an otter'