-
Programmiersprache und Compiler, ähnlich wie Python
-
Auch Forschende ohne CUDA-Erfahrung können damit leicht hocheffizienten GPU-Code für Deep Learning schreiben
→ Es gibt bereits Kernel-Implementierungen, die etwa doppelt so effizient sind wie die Torch-Implementierung
-
Unterstützung für Linux und NVIDIA-GPUs (AMD-GPUs und andere CPUs befinden sich in Entwicklung)
-
Der grundlegende Code ähnelt Numba, verwendet jedoch kein SIMT, sondern führt Berechnungen auf Blockebene parallel innerhalb einer Instanz aus
-
Architektur, die Python-Code in Triton-IR umwandelt und anschließend über den Triton Compiler in LLVM-IR konvertiert
1 Kommentare
Paper des ursprünglichen Autors: http://eecs.harvard.edu/~htk/publication/…
(Philippe Tillet wurde von OpenAI eingestellt und erhält dort weiterhin Unterstützung für die Entwicklung.)