Der Wechsel zu TPU: Ein Rückblick auf 10 Jahre Geschichte spezialisierter AI-Chips

xguru · 2024-08-06T10:46:01+09:00

Vor rund 10 Jahren sagten Google-Forschende voraus, dass der Bedarf an AI-Computing die damaligen Infrastrukturkapazitäten übersteigen würde Als ihnen klar wurde, dass es am Markt keine Alternative gab, die diese Nachfrage decken konnte, begannen sie mit der Entwicklung einer neuen Art von Chip: der TPU (Tensor Processing Unit) Ein Chip für einen bestimmten Zweck Während die CPU als universelles „Gehirn“ des Computers dient, ist die TPU ein spezialiserter Chip, der für AI optimiert ist Die TPU ist ein ASIC (application-specific integrated circuit), der auf matrix- und vektorbasierte mathematische Operationen spezialisiert ist, die für das Erstellen und Ausführen von AI-Modellen erforderlich sind TPU v1, das 2015 intern ausgerollt wurde, war sofort ein Hit bei Google; in den folgenden 10 Jahren entwickelte sich die TPU bei Leistung und Effizienz kontinuierlich weiter Mit dem Innovationstempo von AI Schritt halten Die Entwicklung der TPU ist eng mit Innovationen in Machine Learning und AI verknüpft TPU v1 war auf Inferenz fokussiert, doch schon bald wurde der TPU-v2-Trainings-Supercomputer entwickelt, um das Training von Modellen effizienter zu machen Danach erschienen TPU-Generationen in schnellerer Folge und brachten große Sprünge bei Leistung, Effizienz und Durchsatz In den neuesten Generationen ist die Datenverarbeitung so schnell, dass sogar bei der Verkabelung zwischen den Chips besondere Sorgfalt nötig ist Die Vorteile teilen Schon früh war Google nicht das einzige Unternehmen, das nach besseren Wegen für die Entwicklung und Ausführung von AI-Modellen suchte Anfang 2018 brachte Google Cloud die erste Generation von Cloud TPU auf den Markt, damit Kund:innen ihre eigenen Trainings- und Inferenz-Workloads beschleunigen konnten Heute nutzen bekannte AI-Teams wie Anthropic, Midjourney und Salesforce Cloud TPU in großem Umfang All diese Rechenleistung ist noch immer erst der Anfang Künftig soll sich das Design von Rechenzentren stärker an die Anforderungen von TPU anpassen Es geht längst nicht mehr nur um einen einzelnen Chip oder ein einzelnes TPU-Pod, sondern um den Aufbau eines globalen Netzwerks von mit TPU gefüllten Rechenzentren Die Zukunft ist vollständige Anpassung über den gesamten Stack hinweg – von Silizium bis Beton (The future is full stack customization all the way, from silicon to concrete)

(cloud.google.com)

8 Punkte von xguru 2024-08-06 | 2 Kommentare | Auf WhatsApp teilen

Vor rund 10 Jahren sagten Google-Forschende voraus, dass der Bedarf an AI-Computing die damaligen Infrastrukturkapazitäten übersteigen würde
Als ihnen klar wurde, dass es am Markt keine Alternative gab, die diese Nachfrage decken konnte, begannen sie mit der Entwicklung einer neuen Art von Chip: der TPU (Tensor Processing Unit)

Ein Chip für einen bestimmten Zweck

Während die CPU als universelles „Gehirn“ des Computers dient, ist die TPU ein spezialiserter Chip, der für AI optimiert ist
Die TPU ist ein ASIC (application-specific integrated circuit), der auf matrix- und vektorbasierte mathematische Operationen spezialisiert ist, die für das Erstellen und Ausführen von AI-Modellen erforderlich sind
TPU v1, das 2015 intern ausgerollt wurde, war sofort ein Hit bei Google; in den folgenden 10 Jahren entwickelte sich die TPU bei Leistung und Effizienz kontinuierlich weiter

Mit dem Innovationstempo von AI Schritt halten

Die Entwicklung der TPU ist eng mit Innovationen in Machine Learning und AI verknüpft
TPU v1 war auf Inferenz fokussiert, doch schon bald wurde der TPU-v2-Trainings-Supercomputer entwickelt, um das Training von Modellen effizienter zu machen
Danach erschienen TPU-Generationen in schnellerer Folge und brachten große Sprünge bei Leistung, Effizienz und Durchsatz
In den neuesten Generationen ist die Datenverarbeitung so schnell, dass sogar bei der Verkabelung zwischen den Chips besondere Sorgfalt nötig ist

Die Vorteile teilen

Schon früh war Google nicht das einzige Unternehmen, das nach besseren Wegen für die Entwicklung und Ausführung von AI-Modellen suchte
Anfang 2018 brachte Google Cloud die erste Generation von Cloud TPU auf den Markt, damit Kund:innen ihre eigenen Trainings- und Inferenz-Workloads beschleunigen konnten
Heute nutzen bekannte AI-Teams wie Anthropic, Midjourney und Salesforce Cloud TPU in großem Umfang
All diese Rechenleistung ist noch immer erst der Anfang
Künftig soll sich das Design von Rechenzentren stärker an die Anforderungen von TPU anpassen
Es geht längst nicht mehr nur um einen einzelnen Chip oder ein einzelnes TPU-Pod, sondern um den Aufbau eines globalen Netzwerks von mit TPU gefüllten Rechenzentren
Die Zukunft ist vollständige Anpassung über den gesamten Stack hinweg – von Silizium bis Beton (The future is full stack customization all the way, from silicon to concrete)

2 Kommentare

ing03201 2024-08-06

Das TPU war wirklich ein visionärer Schritt
Bei der Single-Kamera-Verarbeitung des Google Pixel 2 XL hat es das eindrucksvoll gezeigt, und im Zeitalter der LLMs erlebt es jetzt seine goldene Ära
Also bitte mal ein Update für das Coral Micro Dev Board.... schluchz

ganadist 2024-08-06

Der in die frühen Pixel-Modelle integrierte Bildprozessor, der damals als Visual Core bezeichnet wurde, basiert auf Intels Monette-Hill-Plattform.

Tiefgehende Analyse: https://forums.anandtech.com/threads/…
Linux-Kernel-Quellcode des Visual Core: Obwohl es sich nur um Bildverarbeitung handelt, läuft darauf ein kompletter Linux-Kernel. https://android.googlesource.com/kernel/arm64/…