Web LLM – LLMs im Browser mit WebGPU beschleunigt ausführen

xguru · 2023-04-18T10:17:01+09:00

LLMs wie LLaMA und Vicuna ohne Server im Browser mithilfe von WASM ausführen Beschleunigung mit WebGPU, zusätzlich werden auch die von Apache TVM unterstützten GPU-Backends (CUDA, OpenCL, Vulkan) unterstützt Verwendet MLC-Technologie (Machine Learning Compilation)

(github.com/mlc-ai)

14 Punkte von xguru 2023-04-18 | Noch keine Kommentare. | Auf WhatsApp teilen

LLMs wie LLaMA und Vicuna ohne Server im Browser mithilfe von WASM ausführen
Beschleunigung mit WebGPU, zusätzlich werden auch die von Apache TVM unterstützten GPU-Backends (CUDA, OpenCL, Vulkan) unterstützt
Verwendet MLC-Technologie (Machine Learning Compilation)

Web LLM – LLMs im Browser mit WebGPU beschleunigt ausführen

Verwandte Beiträge

Noch keine Kommentare.