Wie AlphaChip das Design von Computerchips revolutioniert hat

(deepmind.google)

7 Punkte von GN⁺ 2024-09-29 | 1 Kommentare | Auf WhatsApp teilen

2020 wurde ein Preprint veröffentlicht, der eine neue Methode des Reinforcement Learning für das Design von Chip-Layouts vorstellte
Diese Methode wurde später in Nature veröffentlicht und als Open Source bereitgestellt
Heute veröffentlichen wir ein Nature-Addendum, das diese Methode und ihre Auswirkungen auf das Chipdesign ausführlich beschreibt
Außerdem veröffentlichen wir vortrainierte Checkpoints, teilen Modellgewichte und stellen den Namen AlphaChip vor
Computerchips haben die erstaunlichen Fortschritte der künstlichen Intelligenz (KI) vorangetrieben, und AlphaChip nutzt KI, um das Chipdesign zu beschleunigen und zu optimieren
Diese Methode wurde verwendet, um in den letzten drei Generationen von Googles kundenspezifischem KI-Beschleuniger Tensor Processing Unit (TPU) Chip-Layouts auf übermenschlichem Niveau zu entwerfen
AlphaChip ist einer der ersten Reinforcement-Learning-Ansätze, der zur Lösung realer Engineering-Probleme eingesetzt wurde
Statt Wochen oder Monate menschlicher Arbeit erzeugt es in wenigen Stunden Chip-Layouts auf übermenschlichem oder vergleichbarem Niveau; diese Layouts werden in einer Vielzahl von Chips eingesetzt, von Rechenzentren auf der ganzen Welt bis hin zu Mobiltelefonen

Wie AlphaChip funktioniert

Das Design eines Chip-Layouts ist keine einfache Aufgabe
Computerchips bestehen aus vielen miteinander verbundenen Blöcken, die sowohl über Hierarchien von Schaltungskomponenten als auch über sehr dünne Leitungen verbunden sind
Außerdem gibt es viele komplexe und miteinander verflochtene Designbeschränkungen, die gleichzeitig erfüllt werden müssen
Aufgrund dieser Komplexität haben Chipdesigner seit mehr als 60 Jahren Schwierigkeiten, den Chip-Floorplanning-Prozess zu automatisieren
Ähnlich wie AlphaGo und AlphaZero haben wir AlphaChip so entwickelt, dass es Chip-Floorplanning als eine Art Spiel angeht
Beginnend mit einem leeren Raster platziert AlphaChip jeweils eine Schaltungskomponente und wiederholt dies, bis alle Komponenten platziert sind
Anschließend erhält es eine Belohnung auf Basis der Qualität des endgültigen Layouts
Mit einem neuen „Edge-basierten“ Graph Neural Network kann AlphaChip die Beziehungen zwischen miteinander verbundenen Chip-Komponenten lernen und über den gesamten Chip hinweg generalisieren, sodass es sich mit jedem entworfenen Layout verbessern kann

Googles KI-Beschleunigerchips mit KI entwerfen

Seit der Veröffentlichung im Jahr 2020 erzeugt AlphaChip Chip-Layouts auf übermenschlichem Niveau, die in allen Generationen von Googles TPU verwendet werden
Diese Chips ermöglichen groß angelegte KI-Modelle auf Basis von Googles Transformer-Architektur
TPU steht im Zentrum leistungsstarker generativer KI-Systeme, von großen Sprachmodellen wie Gemini bis hin zu Bild- und Videogeneratoren wie Imagen und Veo
Diese KI-Beschleuniger sind auch ein Kernbestandteil von Googles KI-Diensten und werden externen Nutzern über Google Cloud angeboten
Um TPU-Layouts zu entwerfen, trainiert AlphaChip zunächst an verschiedenen Chip-Blöcken früherer Generationen, etwa On-Chip- und Chip-übergreifenden Netzwerkblöcken, Speichercontrollern und Datenübertragungspuffern (dies wird als Vortraining bezeichnet)
Anschließend wird AlphaChip auf aktuellen TPU-Blöcken ausgeführt, um hochwertige Layouts zu erzeugen
Anders als frühere Ansätze wird AlphaChip, ähnlich wie menschliche Experten, umso besser und schneller, je mehr Instanzen von Chip-Placement-Aufgaben es löst
Für jede neue TPU-Generation, einschließlich des neuesten Trillium (6. Generation), hat AlphaChip bessere Chip-Layouts entworfen und einen größeren Teil des gesamten Floorplans geliefert, wodurch der Designzyklus beschleunigt und leistungsfähigere Chips produziert wurden

Die breite Wirkung von AlphaChip

Die Wirkung von AlphaChip zeigt sich in Anwendungen bei Alphabet, in der Forschungsgemeinschaft und in der gesamten Chipdesign-Industrie
Über das Design spezialisierter KI-Beschleuniger wie TPU hinaus hat AlphaChip Layouts für andere Chips innerhalb von Alphabet erzeugt, etwa für den Axion-Prozessor, Googles ersten Arm-basierten Allzweck-Rechenzentrums-CPU
Auch externe Organisationen übernehmen AlphaChip und bauen darauf auf (zum Beispiel hat MediaTek, eines der weltweit führenden Chipdesign-Unternehmen, AlphaChip erweitert, um Energieverbrauch, Leistung und Chipfläche zu verbessern und gleichzeitig die Entwicklung seiner fortschrittlichsten Chips wie Dimensity Flagship 5G, das in Samsung-Smartphones eingesetzt wird, zu beschleunigen)
AlphaChip hat eine Explosion von KI-Arbeiten für das Chipdesign ausgelöst und wurde auf andere wichtige Schritte des Chipdesigns ausgeweitet, etwa Logiksynthese und Makroauswahl

Chips der Zukunft bauen

Wir glauben, dass AlphaChip das Potenzial hat, jeden Schritt des Chipdesign-Zyklus zu optimieren, von der Computerarchitektur bis zur Fertigung
Es könnte das Chipdesign für kundenspezifische Hardware in Alltagsgeräten revolutionieren, darunter Smartphones, medizinische Geräte und landwirtschaftliche Sensoren
Künftige Versionen von AlphaChip sind bereits in Entwicklung, und wir freuen uns darauf, gemeinsam mit der Community weiter in diesem Bereich zu innovieren und eine Zukunft zu schaffen, in der Chips schneller, günstiger und energieeffizienter sind

Meinung von GN⁺

AlphaChips KI-basierter Ansatz revolutioniert das Chipdesign. Insbesondere bei der Automatisierung des Chip-Layout-Designprozesses wurden große Fortschritte erzielt
AlphaChip ist eines der frühen Beispiele für den Einsatz von Reinforcement Learning bei realen Engineering-Problemen und ein gutes Beispiel dafür, wie KI in der realen Welt genutzt werden kann
Der Einfluss von AlphaChip auf das TPU-Design dürfte ein wichtiger Meilenstein für die Weiterentwicklung von KI-Beschleuniger-Hardware sein. Bessere KI-Beschleuniger werden leistungsfähigere KI-Modelle ermöglichen, was wiederum den Fortschritt der KI weiter beschleunigen wird
Eine übermäßige Abhängigkeit von KI-Design-Tools könnte jedoch zu einem Verlust an Fachwissen bei menschlichen Designern führen. Langfristig dürfte die Zusammenarbeit zwischen KI und menschlichen Experten am wünschenswertesten sein
Ähnliche KI-basierte Design-Tools sind etwa Cadence Cerebrus und Synopsys DSO.ai. Es ist zu erwarten, dass sich der Wettbewerb zwischen KI-basierten Design-Automatisierungstools künftig verschärfen wird

1 Kommentare

GN⁺ 2024-09-29

Hacker-News-Kommentare

Googles Nature-Artikel wurde von Forschern aus dem EDA/CAD-Bereich kritisiert
- Erwiderungspaper von Google-internen Forschern: "Stronger Baselines for Evaluating Deep Reinforcement Learning in Chip Placement"
- 2023-ISPD-Paper des UCSD-Teams: "Assessment of Reinforcement Learning for Macro Placement"
- Kritisches Paper von Igor Markov: "The False Dawn: Reevaluating Google's Reinforcement Learning for Chip Macro Placement"
Googles RL-Algorithmus für Macro Placement wurde nicht fair mit anderen aktuellen Algorithmen verglichen
- Es wird behauptet, bei der Makroplatzierung besser als Menschen zu sein, erreicht aber nicht die Leistung heutiger Mixed-Placement-Algorithmen
- Die RL-Technik benötigt mehr Rechenressourcen als andere Algorithmen und lernt keine neue Darstellung des Platzierungsproblems selbst, sondern eine Ersatzfunktion
Skepsis gegenüber Googles Arbeit; dazu wurde ein ausführlicher Beitrag auf einer persönlichen Website verfasst
Es gibt Fälle, in denen Google-Forscher schikaniert wurden und deshalb zu Anthropic wechselten
- Zugehöriger Artikel: "Google Brain AI Researcher Fired Tension"
TSMC betont, dass moderne Software zur Automatisierung des Chipdesigns in der Lage ist, Logikdesigns für TDP auszuwählen
- Das könnte ein Weg sein, Dennard Scaling aufrechtzuerhalten
- Die Lichtgeschwindigkeit und physische Nähe bleiben zwar wichtig, aber es stellt sich die Frage, wie viel Vorteil die Vermeidung von Thermal Throttling bringt
Frage danach, wie die Qualität von Chipdesign gemessen wird
- Es stellt sich die Frage, ob die von Google gemeldeten Metriken sinnvoll sind oder nur dazu dienen, Google besser aussehen zu lassen
- Die "Qualität" eines Chipdesigns ist vielschichtig und stark vom Anwendungsfall abhängig
- Ein Chip für Rechenzentren und ein Chip für eine Smartphone-Kamera oder ein Auto werden sehr unterschiedlich aussehen
- Es stellt sich die Frage, was in genau diesem Problem bzw. dieser Aufgabe "besser" bedeutet
Eurisco wurde früher für Place-and-Route-Aufgaben verwendet und lieferte sehr gute Ergebnisse
- Eurisco wurde verwendet, um Kampfraumschiff-Flotten für das Spiel Traveler TCS zu entwerfen
- Eurisco nutzte symmetriebasierte Platzierung, die es im VLSI-Design gelernt hatte
- Es stellt sich die Frage, ob die Heuristiken von AlphaChip auch anderswo eingesetzt werden könnten
Googles Arbeit am Chipdesign ist "umstritten"
- Es stellt sich die Frage, warum nur PR gemacht wird, statt wirklich etwas Neues zu leisten
Das Problem, dass viele DeepX-Paper bei Nature statt in geeigneten CS-Foren eingereicht werden
- Wenn man im Chipdesign bessere Arbeit leistet, sollte man bei ISPD oder ISCA usw. einreichen
- Es ist unklar, wie Nature mit solchen Papern umgeht
Es stellt sich die Frage, warum ständig der Ausdruck "übermenschlich" verwendet wird
- Algorithmen werden für solche Aufgaben eingesetzt; Menschen platzieren nicht Billionen von Transistoren von Hand
Es wäre wünschenswert, Werkzeuge für PCB-Design/Layout zu haben
Es stellt sich die Frage, wie nah speicherbasiertes Computing daran ist, den Sprung von der Forschung zu wettbewerbsfähigen Produkten zu schaffen
- Es wird angenommen, dass der Zeitpunkt gekommen ist, sehr offensiv in die Skalierung von Experimenten wie Memristoren zu investieren
- Es wird darüber diskutiert, wie viele neue Reaktoren für AI-Rechenzentren benötigt werden

Wie AlphaChip das Design von Computerchips revolutioniert hat

Wie AlphaChip funktioniert

Googles KI-Beschleunigerchips mit KI entwerfen

Die breite Wirkung von AlphaChip

Chips der Zukunft bauen

Meinung von GN⁺

Verwandte Beiträge

1 Kommentare

Hacker-News-Kommentare