7 Punkte von xguru 2021-07-29 | 1 Kommentare | Auf WhatsApp teilen
  • Programmiersprache und Compiler, ähnlich wie Python

  • Auch Forschende ohne CUDA-Erfahrung können damit leicht hocheffizienten GPU-Code für Deep Learning schreiben

→ Es gibt bereits Kernel-Implementierungen, die etwa doppelt so effizient sind wie die Torch-Implementierung

  • Unterstützung für Linux und NVIDIA-GPUs (AMD-GPUs und andere CPUs befinden sich in Entwicklung)

  • Der grundlegende Code ähnelt Numba, verwendet jedoch kein SIMT, sondern führt Berechnungen auf Blockebene parallel innerhalb einer Instanz aus

  • Architektur, die Python-Code in Triton-IR umwandelt und anschließend über den Triton Compiler in LLVM-IR konvertiert

1 Kommentare

 
xguru 2021-07-29

Paper des ursprünglichen Autors: http://eecs.harvard.edu/~htk/publication/…

(Philippe Tillet wurde von OpenAI eingestellt und erhält dort weiterhin Unterstützung für die Entwicklung.)