Tenstorrent unter Leitung von Jim Keller stellt mit Grayskull eine RISC-V-basierte Antwort auf GPUs vor

(techradar.com)

10 Punkte von GN⁺ 2024-03-11 | 2 Kommentare | Auf WhatsApp teilen

Tenstorrent ist ein Unternehmen unter der Leitung des bekannten Chipdesigners Jim Keller, der an AMDs Zen-Architektur und Teslas Chips für autonomes Fahren mitgewirkt hat
Mit Grayskull wurde eine auf RISC-V basierende GPU-Alternative vorgestellt, die sich leicht programmieren und skalieren lässt und sich bei der Ausführung besonders für Sparsity und bedingte Berechnungen eignet
Vorgestellt wurden Entwickler-Kits in zwei Versionen, Grayskull e75 und Grayskull e150. Es handelt sich um reine Inferenz-Hardware für die AI-Entwicklung, zusammen mit der Software TT-Buda und TT-Metalium
Tenstorrent ist eine Partnerschaft mit Japans führendem Halbleiter-Technologiezentrum (LSTC) eingegangen.
Geplant ist der Bau eines hochmodernen 2-nm-AI-Beschleunigers unter Verwendung von Tenstorrents RISC-V- und Chiplet-IP

Die Power von Grayskull!

Das Modell Grayskull e75 integriert einen einzelnen Grayskull-Prozessor auf einer Low-Profile-PCIe-Gen-4-Karte halber Länge, die mit 75 W betrieben wird.
Das Modell Grayskull e150 integriert einen Grayskull-Prozessor auf einer PCIe-Gen-4-Karte in Standardhöhe und 3/4-Länge, die mit bis zu 200 W betrieben wird, und bietet eine ausgewogene Balance aus Leistung und Durchsatz.

Tenstorrent-Prozessoren und DevKits

Die Tenstorrent-Prozessoren bestehen aus einem Gitter von Kernen namens Tensix-Cores und verfügen über Netzwerk-Kommunikationshardware, mit der sie direkt über das Netzwerk miteinander kommunizieren können, ohne DRAM zu durchlaufen.
Die Grayskull DevKits unterstützen verschiedene Modelle, darunter BERT für Natural Language Processing, ResNet für Bilderkennung, Whisper für Spracherkennung und Übersetzung, YOLOv5 für Objekterkennung in Echtzeit sowie U-Net für Bildsegmentierung.
Die DevKits Grayskull e75 und e150 sind für jeweils 599 US-Dollar und 799 US-Dollar erhältlich.

Meinung von GN⁺

Tenstorrents Grayskull kann als RISC-V-basierte Alternative zu traditionellen GPUs der Branche mehr Vielfalt verleihen, indem es AI-Entwicklern eine neue Option bietet.
Dass Grayskull auf Sparsity und bedingte Berechnungen zur Laufzeit spezialisiert ist, birgt Potenzial zur Verbesserung von Effizienz und Performance von AI-Modellen.
Bei der Einführung dieser Technologie sollten die Kompatibilität mit bestehenden Entwicklungsumgebungen, die Unterstützung im Ökosystem sowie die langfristige Performance- und Kosteneffizienz berücksichtigt werden.
Andere Produkte der Branche mit ähnlichen Funktionen sind unter anderem GPUs von NVIDIA und TPUs von Google, Grayskull unterscheidet sich jedoch durch seine auf RISC-V basierende Architektur.
Der Erfolg von Grayskull könnte Wachstum und Innovation im Open-Source-Hardware-Ökosystem fördern und damit zur Demokratisierung von Technologie und zu besserer Zugänglichkeit beitragen.

2 Kommentare

ryudaewan 2024-03-12

Jim Keller scheint wohl ein He-Man-Fan zu sein. https://youtu.be/V8h8snfYidg?feature=shared

GN⁺ 2024-03-11

Hacker-News-Kommentare

Zusammenfassung zum Grayskull-Entwicklungskit:
- Grayskull e75: 75 W Leistungsaufnahme, 96 Tensix-Kerne, 1 GHz Taktfrequenz, 96 MB SRAM, 8 GB LPDDR4-Speicher (102,4 GB/s), Preis 599 $
- Grayskull e150: 200 W Leistungsaufnahme, 120 Tensix-Kerne, 1,2 GHz Taktfrequenz, 120 MB SRAM, 8 GB LPDDR4-Speicher (118,4 GB/s), Preis 799 $
- Es besteht Interesse daran, wie sich die Inferenzleistung dieser Produkte im Vergleich zu Grafikkarten verhält und ob sie für ein Home-Lab geeignet sind.
- Es gibt ein Unboxing-Interview zur Preview-Version des Produkts, aber keine Leistungskennzahlen.
Meinungen zur Architektur:
- Die Beteiligung von Jim Keller weckt Interesse, aber für Menschen ohne Wissen über CPU-/ASIC-Design wirkt die Architektur etwas „bizarr“.
- Kerngitter, Speicher und Schnittstellen sind vermischt, und es wird um eine Erklärung der netzwerkverbundenen Topologie gebeten.
Erklärung zur Funktionsweise der Architektur:
- Ein Basissystem, das aus Tensix-Kernen und gemeinsam genutztem Speicher besteht.
- Jeder Tensix-Kern enthält eine High-Density-Tensormathe-Einheit (FPU) für Tensoroperationen, eine SIMD-Engine (SFPU), 5 RISC-V-CPU-Kerne und einen großen lokalen Speicher.
- Die Kerne sind in Form zweier gegenläufiger ringförmiger Verbindungen gekoppelt.
- Die RISC-V-Kerne werden verwendet, um FPU und SFPU zu steuern sowie Daten vorzubereiten und zu verschieben.
- Die SFPU ist eine allgemeinere SIMT-Engine, die von den RISC-V-Kernen aus angesteuert werden kann.
- Einen SFPU-Simulator kann man auf GitHub ausprobieren, und das Programmiermodell ist in Low-Level-Kernel-Beispielen zu sehen.
- Die Grayskull-SFPU hat 4 allgemeine LRegs, die jeweils 64 Werte mit 19 Bit speichern können; Wormhole hat 8 allgemeine LRegs, die jeweils 32 Werte mit 32 Bit speichern können.
- Die Wormhole-SFPU bietet im Vergleich zu Grayskull etwa die dreifache IPC sowie einige neue SFPU-Befehle.
- Weitere Informationen finden sich in der Dokumentation und beim Durchsehen des GitHub-Repositorys.
Fragen zur Modellauswahl:
- Es wird gefragt, warum mit Modellen wie BERT, ResNet, Whisper, YOLOv5 und U-Net begonnen wird.
- Es wird vermutet, dass Energieeffizienz das Ziel ist, aber das passt nicht vollständig zusammen.
Fragen zu den Systemanforderungen:
- Es wird infrage gestellt, warum das Host-System 64 GB RAM benötigt.
- Ein Inferenzserver sollte doch abgesehen von der Inferenzhardware nur eine minimale Konfiguration brauchen.
Vergleich mit kundenspezifischem Silizium anderer Unternehmen:
- Es wird gefragt, wie sich diese Art von Prozessoren mit kundenspezifischem Silizium von AWS, Google und Tesla vergleichen lässt.
Ähnlichkeiten der Architektur:
- Es wirkt ähnlich zu der Art und Weise, wie Intels Projekt Larrabee GPU funktionieren sollte, nur mit RISC-V.
Enttäuschung über reine Inferenzlösungen:
- Es wird als ermüdend empfunden, dass vielversprechende Startups wie Groq und Tenstorrent nur Inferenzlösungen anbieten.
- Über den offiziellen Groq-Kanal wurde erfahren, dass keine Investitionen geplant sind, um Training zu ermöglichen.
- Das ist zwar nachvollziehbar, weil die Inferenznachfrage millionenfach höher sein könnte als die Trainingsnachfrage, bleibt aber dennoch enttäuschend.
Anzahl der RISC-V-Kerne im Grayskull™ e150:
- Grayskull™ e150 hat 120 Tensix-Kerne, die jeweils 5 RISC-V-Kerne enthalten, also insgesamt 600 RISC-V-CPU-Kerne.
Mangel an Informationen zu Leistung und Architektur:
- Es lassen sich keine detaillierten Informationen zu Leistung oder Architektur finden.
- Für ein ML-zentriertes Gerät ist die Speicherbandbreite sehr niedrig und der Preis sehr hoch.
- Es wird gefragt, was dabei möglicherweise übersehen wird.