Cloud TPU v5e
- Die kosteneffizienteste, vielseitigste und am besten skalierbare Cloud TPU mit Integration in wichtige Frameworks wie Google Kubernetes Engine (GKE), Vertex AI, Pytorch, JAX und TensorFlow
- Bietet im Vergleich zu Cloud TPU v4 für LLMs und Gen-AI-Modelle eine bis zu 2-mal höhere Trainingsleistung pro Dollar und eine bis zu 2,5-mal höhere Inferenzleistung
- Unterstützt 8 verschiedene Konfigurationen virtueller Maschinen (VMs), damit sich passende Setups für verschiedene Größen von LLM- und Gen-AI-Modellen auswählen lassen
- Mit der Einführung der Multislice-Technologie können Nutzer AI-Modelle über die Grenzen physischer TPU-Pods hinaus auf Zehntausende Cloud TPU v5e- oder TPU-v4-Chips skalieren
A3 GPU VM
- Ausgestattet mit NVIDIAs H100 Tensor Core GPU. Speziell entwickelt, um besonders anspruchsvolle Gen-AI-Workloads und LLMs zu trainieren und bereitzustellen; allgemein verfügbar ab dem nächsten Monat
- A3 VMs bieten im Vergleich zur vorherigen Generation 3-mal schnelleres Training und 10-mal höhere Netzwerkbandbreite und liefern damit große Skalierung und hohe Leistung
Noch keine Kommentare.