Google Cloud stellt Cloud TPU v5e und A3 GPU VM auf Basis von Nvidia H100 vor

(cloud.google.com)

4 Punkte von GN⁺ 2023-09-03 | Noch keine Kommentare. | Auf WhatsApp teilen

Cloud TPU v5e

Die kosteneffizienteste, vielseitigste und am besten skalierbare Cloud TPU mit Integration in wichtige Frameworks wie Google Kubernetes Engine (GKE), Vertex AI, Pytorch, JAX und TensorFlow
Bietet im Vergleich zu Cloud TPU v4 für LLMs und Gen-AI-Modelle eine bis zu 2-mal höhere Trainingsleistung pro Dollar und eine bis zu 2,5-mal höhere Inferenzleistung
Unterstützt 8 verschiedene Konfigurationen virtueller Maschinen (VMs), damit sich passende Setups für verschiedene Größen von LLM- und Gen-AI-Modellen auswählen lassen
Mit der Einführung der Multislice-Technologie können Nutzer AI-Modelle über die Grenzen physischer TPU-Pods hinaus auf Zehntausende Cloud TPU v5e- oder TPU-v4-Chips skalieren

Ausgestattet mit NVIDIAs H100 Tensor Core GPU. Speziell entwickelt, um besonders anspruchsvolle Gen-AI-Workloads und LLMs zu trainieren und bereitzustellen; allgemein verfügbar ab dem nächsten Monat
A3 VMs bieten im Vergleich zur vorherigen Generation 3-mal schnelleres Training und 10-mal höhere Netzwerkbandbreite und liefern damit große Skalierung und hohe Leistung