- Auf der GTC 2022 wurden die Next-Generation-Architektur Hopper™ und die darauf basierende H100 vorgestellt.
→ Benannt nach Grace Hopper. Baut auf der Ampere-Architektur auf.
- Sechs technologische Innovationen zur Beschleunigung von groß angelegter KI und HPC
- 80 Milliarden Transistoren im TSMC-4-Nanometer-Prozess. Erste GPU mit Unterstützung für PCIe Gen5 und Nutzung von HBM3-Speicher (3 TB/s Speicherbandbreite)
- Neue Transformer Engine mit 6-facher Beschleunigung gegenüber der vorherigen Generation
- Sichere Multi-Instance-GPU-Technologie (MIG) der 2. Generation: Eine GPU kann in kleinere Segmente partitioniert werden, um isolierte Workloads auszuführen. Mit der Hopper-Architektur wurde MIG gegenüber der bisherigen Generation um das 7-Fache verbessert
- Erster Beschleuniger für Confidential Computing zum Schutz von KI-Modellen während der Verarbeitung und von Kundendaten
- NVIDIA NVLink der 4. Generation: Verbindet bis zu 256 H100-GPUs mit 9-fach höherer Bandbreite (im Vergleich zu NVIDIA HDR Quantum InfiniBand)
- Neue DPX-Befehle beschleunigen „dynamische Programmierung“, wie sie in Algorithmen, Pfadoptimierung und Genomik verwendet wird. 7-mal schneller als GPUs der vorherigen Generation und 40-mal schneller als CPUs
- Unterstützt das Sprachmodell Megatron 530B mit bis zu 30-mal höherem Durchsatz als die vorherige Generation
1 Kommentare
MS und Nvidia kündigen das weltweit größte Sprachmodell MT-NLG 530B an