- Vor rund 10 Jahren sagten Google-Forschende voraus, dass der Bedarf an AI-Computing die damaligen Infrastrukturkapazitäten übersteigen würde
- Als ihnen klar wurde, dass es am Markt keine Alternative gab, die diese Nachfrage decken konnte, begannen sie mit der Entwicklung einer neuen Art von Chip: der TPU (Tensor Processing Unit)
Ein Chip für einen bestimmten Zweck
- Während die CPU als universelles „Gehirn“ des Computers dient, ist die TPU ein spezialiserter Chip, der für AI optimiert ist
- Die TPU ist ein ASIC (application-specific integrated circuit), der auf matrix- und vektorbasierte mathematische Operationen spezialisiert ist, die für das Erstellen und Ausführen von AI-Modellen erforderlich sind
- TPU v1, das 2015 intern ausgerollt wurde, war sofort ein Hit bei Google; in den folgenden 10 Jahren entwickelte sich die TPU bei Leistung und Effizienz kontinuierlich weiter
Mit dem Innovationstempo von AI Schritt halten
- Die Entwicklung der TPU ist eng mit Innovationen in Machine Learning und AI verknüpft
- TPU v1 war auf Inferenz fokussiert, doch schon bald wurde der TPU-v2-Trainings-Supercomputer entwickelt, um das Training von Modellen effizienter zu machen
- Danach erschienen TPU-Generationen in schnellerer Folge und brachten große Sprünge bei Leistung, Effizienz und Durchsatz
- In den neuesten Generationen ist die Datenverarbeitung so schnell, dass sogar bei der Verkabelung zwischen den Chips besondere Sorgfalt nötig ist
Die Vorteile teilen
- Schon früh war Google nicht das einzige Unternehmen, das nach besseren Wegen für die Entwicklung und Ausführung von AI-Modellen suchte
- Anfang 2018 brachte Google Cloud die erste Generation von Cloud TPU auf den Markt, damit Kund:innen ihre eigenen Trainings- und Inferenz-Workloads beschleunigen konnten
- Heute nutzen bekannte AI-Teams wie Anthropic, Midjourney und Salesforce Cloud TPU in großem Umfang
- All diese Rechenleistung ist noch immer erst der Anfang
- Künftig soll sich das Design von Rechenzentren stärker an die Anforderungen von TPU anpassen
- Es geht längst nicht mehr nur um einen einzelnen Chip oder ein einzelnes TPU-Pod, sondern um den Aufbau eines globalen Netzwerks von mit TPU gefüllten Rechenzentren
- Die Zukunft ist vollständige Anpassung über den gesamten Stack hinweg – von Silizium bis Beton (The future is full stack customization all the way, from silicon to concrete)
2 Kommentare
Das TPU war wirklich ein visionärer Schritt
Bei der Single-Kamera-Verarbeitung des Google Pixel 2 XL hat es das eindrucksvoll gezeigt, und im Zeitalter der LLMs erlebt es jetzt seine goldene Ära
Also bitte mal ein Update für das Coral Micro Dev Board.... schluchz
Der in die frühen Pixel-Modelle integrierte Bildprozessor, der damals als Visual Core bezeichnet wurde, basiert auf Intels Monette-Hill-Plattform.