4 Punkte von GN⁺ 2023-09-03 | Noch keine Kommentare. | Auf WhatsApp teilen

Cloud TPU v5e

  • Die kosteneffizienteste, vielseitigste und am besten skalierbare Cloud TPU mit Integration in wichtige Frameworks wie Google Kubernetes Engine (GKE), Vertex AI, Pytorch, JAX und TensorFlow
  • Bietet im Vergleich zu Cloud TPU v4 für LLMs und Gen-AI-Modelle eine bis zu 2-mal höhere Trainingsleistung pro Dollar und eine bis zu 2,5-mal höhere Inferenzleistung
  • Unterstützt 8 verschiedene Konfigurationen virtueller Maschinen (VMs), damit sich passende Setups für verschiedene Größen von LLM- und Gen-AI-Modellen auswählen lassen
  • Mit der Einführung der Multislice-Technologie können Nutzer AI-Modelle über die Grenzen physischer TPU-Pods hinaus auf Zehntausende Cloud TPU v5e- oder TPU-v4-Chips skalieren

A3 GPU VM

  • Ausgestattet mit NVIDIAs H100 Tensor Core GPU. Speziell entwickelt, um besonders anspruchsvolle Gen-AI-Workloads und LLMs zu trainieren und bereitzustellen; allgemein verfügbar ab dem nächsten Monat
  • A3 VMs bieten im Vergleich zur vorherigen Generation 3-mal schnelleres Training und 10-mal höhere Netzwerkbandbreite und liefern damit große Skalierung und hohe Leistung

Noch keine Kommentare.

Noch keine Kommentare.