8 Punkte von xguru 2024-08-06 | 2 Kommentare | Auf WhatsApp teilen
  • Vor rund 10 Jahren sagten Google-Forschende voraus, dass der Bedarf an AI-Computing die damaligen Infrastrukturkapazitäten übersteigen würde
  • Als ihnen klar wurde, dass es am Markt keine Alternative gab, die diese Nachfrage decken konnte, begannen sie mit der Entwicklung einer neuen Art von Chip: der TPU (Tensor Processing Unit)

Ein Chip für einen bestimmten Zweck

  • Während die CPU als universelles „Gehirn“ des Computers dient, ist die TPU ein spezialiserter Chip, der für AI optimiert ist
  • Die TPU ist ein ASIC (application-specific integrated circuit), der auf matrix- und vektorbasierte mathematische Operationen spezialisiert ist, die für das Erstellen und Ausführen von AI-Modellen erforderlich sind
  • TPU v1, das 2015 intern ausgerollt wurde, war sofort ein Hit bei Google; in den folgenden 10 Jahren entwickelte sich die TPU bei Leistung und Effizienz kontinuierlich weiter

Mit dem Innovationstempo von AI Schritt halten

  • Die Entwicklung der TPU ist eng mit Innovationen in Machine Learning und AI verknüpft
  • TPU v1 war auf Inferenz fokussiert, doch schon bald wurde der TPU-v2-Trainings-Supercomputer entwickelt, um das Training von Modellen effizienter zu machen
  • Danach erschienen TPU-Generationen in schnellerer Folge und brachten große Sprünge bei Leistung, Effizienz und Durchsatz
  • In den neuesten Generationen ist die Datenverarbeitung so schnell, dass sogar bei der Verkabelung zwischen den Chips besondere Sorgfalt nötig ist

Die Vorteile teilen

  • Schon früh war Google nicht das einzige Unternehmen, das nach besseren Wegen für die Entwicklung und Ausführung von AI-Modellen suchte
  • Anfang 2018 brachte Google Cloud die erste Generation von Cloud TPU auf den Markt, damit Kund:innen ihre eigenen Trainings- und Inferenz-Workloads beschleunigen konnten
  • Heute nutzen bekannte AI-Teams wie Anthropic, Midjourney und Salesforce Cloud TPU in großem Umfang
  • All diese Rechenleistung ist noch immer erst der Anfang
  • Künftig soll sich das Design von Rechenzentren stärker an die Anforderungen von TPU anpassen
  • Es geht längst nicht mehr nur um einen einzelnen Chip oder ein einzelnes TPU-Pod, sondern um den Aufbau eines globalen Netzwerks von mit TPU gefüllten Rechenzentren
  • Die Zukunft ist vollständige Anpassung über den gesamten Stack hinweg – von Silizium bis Beton (The future is full stack customization all the way, from silicon to concrete)

2 Kommentare

 
ing03201 2024-08-06

Das TPU war wirklich ein visionärer Schritt
Bei der Single-Kamera-Verarbeitung des Google Pixel 2 XL hat es das eindrucksvoll gezeigt, und im Zeitalter der LLMs erlebt es jetzt seine goldene Ära
Also bitte mal ein Update für das Coral Micro Dev Board.... schluchz

 
ganadist 2024-08-06

Der in die frühen Pixel-Modelle integrierte Bildprozessor, der damals als Visual Core bezeichnet wurde, basiert auf Intels Monette-Hill-Plattform.