Burn – Tensor-Bibliothek der nächsten Generation mit Flexibilität, Effizienz und Portabilität

xguru · 2025-11-04T09:31:01+09:00

Rust-basierte Hochleistungs-Tensor-Bibliothek und Deep-Learning-Framework für numerische Berechnungen, Modellinferenz und Training Optimierungsleistung auf dem Niveau statischer Graph-Frameworks bei gleichzeitiger dynamischer Flexibilität Unterstützung für mehrere GPU/CPU-Backends GPU: CUDA, ROCm, Metal, Vulkan, WebGPU, LibTorch, Candle usw. CPU: auf Basis von CubeCL, NdArray, Candle und LibTorch Lauffähig auch in Wasm- und no_std-Umgebungen Entworfen rund um das Backend-Trait, mit einer austauschbaren Backend-Architektur für unterschiedliche Hardware- und Laufzeitumgebungen Autodiff-Backend-Dekorator: fügt allen Backends automatische Differenzierung hinzu Fusion-Backend-Dekorator: Kernel-Fusion-Funktion Router-Backend: unterstützt die Verteilung von Operationen über mehrere Hardware-Typen wie CPU und GPU Remote-Backend: ermöglicht verteilte Berechnungen und Remote-Ausführung über das Netzwerk Integrierte Unterstützung für den gesamten Ablauf von Training und Inferenz Echtzeit-Monitoring des Trainings mit einem terminalbasierten Dashboard auf Ratatui-Basis Deployment desselben Codes von eingebetteten Geräten bis hin zu großen GPU-Clustern Wiederverwendung bestehender Modelle durch Import von PyTorch-, Safetensors- und ONNX-Modellen Browser-Inferenz auf Basis von WebAssembly und WebGPU Unterstützung für no_std-Umgebungen, sodass auch auf Embedded-Geräten ohne Betriebssystem lauffähig Veröffentlicht unter einer Dual-Lizenz aus MIT und Apache 2.0

(github.com/tracel-ai)

13 Punkte von xguru 2025-11-04 | 2 Kommentare | Auf WhatsApp teilen

Rust-basierte Hochleistungs-Tensor-Bibliothek und Deep-Learning-Framework für numerische Berechnungen, Modellinferenz und Training
Optimierungsleistung auf dem Niveau statischer Graph-Frameworks bei gleichzeitiger dynamischer Flexibilität
Unterstützung für mehrere GPU/CPU-Backends
- GPU: CUDA, ROCm, Metal, Vulkan, WebGPU, LibTorch, Candle usw.
- CPU: auf Basis von CubeCL, NdArray, Candle und LibTorch
- Lauffähig auch in Wasm- und no_std-Umgebungen
Entworfen rund um das Backend-Trait, mit einer austauschbaren Backend-Architektur für unterschiedliche Hardware- und Laufzeitumgebungen
- Autodiff-Backend-Dekorator: fügt allen Backends automatische Differenzierung hinzu
- Fusion-Backend-Dekorator: Kernel-Fusion-Funktion
- Router-Backend: unterstützt die Verteilung von Operationen über mehrere Hardware-Typen wie CPU und GPU
- Remote-Backend: ermöglicht verteilte Berechnungen und Remote-Ausführung über das Netzwerk
Integrierte Unterstützung für den gesamten Ablauf von Training und Inferenz
- Echtzeit-Monitoring des Trainings mit einem terminalbasierten Dashboard auf Ratatui-Basis
- Deployment desselben Codes von eingebetteten Geräten bis hin zu großen GPU-Clustern
- Wiederverwendung bestehender Modelle durch Import von PyTorch-, Safetensors- und ONNX-Modellen
- Browser-Inferenz auf Basis von WebAssembly und WebGPU
Unterstützung für no_std-Umgebungen, sodass auch auf Embedded-Geräten ohne Betriebssystem lauffähig
Veröffentlicht unter einer Dual-Lizenz aus MIT und Apache 2.0

2 Kommentare

brainer 2025-11-04

Ich bin gespannt, wie die Leistung im Vergleich zu PyTorch ist.

coremaker 2025-11-04

Rust, Wasm, WebGPU – das sind erfreulich vertraute Namen.

Burn – Tensor-Bibliothek der nächsten Generation mit Flexibilität, Effizienz und Portabilität

Verwandte Beiträge

2 Kommentare