7 Punkte von GN⁺ 2024-09-29 | 1 Kommentare | Auf WhatsApp teilen
  • 2020 wurde ein Preprint veröffentlicht, der eine neue Methode des Reinforcement Learning für das Design von Chip-Layouts vorstellte
  • Diese Methode wurde später in Nature veröffentlicht und als Open Source bereitgestellt
  • Heute veröffentlichen wir ein Nature-Addendum, das diese Methode und ihre Auswirkungen auf das Chipdesign ausführlich beschreibt
  • Außerdem veröffentlichen wir vortrainierte Checkpoints, teilen Modellgewichte und stellen den Namen AlphaChip vor
  • Computerchips haben die erstaunlichen Fortschritte der künstlichen Intelligenz (KI) vorangetrieben, und AlphaChip nutzt KI, um das Chipdesign zu beschleunigen und zu optimieren
  • Diese Methode wurde verwendet, um in den letzten drei Generationen von Googles kundenspezifischem KI-Beschleuniger Tensor Processing Unit (TPU) Chip-Layouts auf übermenschlichem Niveau zu entwerfen
  • AlphaChip ist einer der ersten Reinforcement-Learning-Ansätze, der zur Lösung realer Engineering-Probleme eingesetzt wurde
  • Statt Wochen oder Monate menschlicher Arbeit erzeugt es in wenigen Stunden Chip-Layouts auf übermenschlichem oder vergleichbarem Niveau; diese Layouts werden in einer Vielzahl von Chips eingesetzt, von Rechenzentren auf der ganzen Welt bis hin zu Mobiltelefonen

Wie AlphaChip funktioniert

  • Das Design eines Chip-Layouts ist keine einfache Aufgabe
  • Computerchips bestehen aus vielen miteinander verbundenen Blöcken, die sowohl über Hierarchien von Schaltungskomponenten als auch über sehr dünne Leitungen verbunden sind
  • Außerdem gibt es viele komplexe und miteinander verflochtene Designbeschränkungen, die gleichzeitig erfüllt werden müssen
  • Aufgrund dieser Komplexität haben Chipdesigner seit mehr als 60 Jahren Schwierigkeiten, den Chip-Floorplanning-Prozess zu automatisieren
  • Ähnlich wie AlphaGo und AlphaZero haben wir AlphaChip so entwickelt, dass es Chip-Floorplanning als eine Art Spiel angeht
  • Beginnend mit einem leeren Raster platziert AlphaChip jeweils eine Schaltungskomponente und wiederholt dies, bis alle Komponenten platziert sind
  • Anschließend erhält es eine Belohnung auf Basis der Qualität des endgültigen Layouts
  • Mit einem neuen „Edge-basierten“ Graph Neural Network kann AlphaChip die Beziehungen zwischen miteinander verbundenen Chip-Komponenten lernen und über den gesamten Chip hinweg generalisieren, sodass es sich mit jedem entworfenen Layout verbessern kann

Googles KI-Beschleunigerchips mit KI entwerfen

  • Seit der Veröffentlichung im Jahr 2020 erzeugt AlphaChip Chip-Layouts auf übermenschlichem Niveau, die in allen Generationen von Googles TPU verwendet werden
  • Diese Chips ermöglichen groß angelegte KI-Modelle auf Basis von Googles Transformer-Architektur
  • TPU steht im Zentrum leistungsstarker generativer KI-Systeme, von großen Sprachmodellen wie Gemini bis hin zu Bild- und Videogeneratoren wie Imagen und Veo
  • Diese KI-Beschleuniger sind auch ein Kernbestandteil von Googles KI-Diensten und werden externen Nutzern über Google Cloud angeboten
  • Um TPU-Layouts zu entwerfen, trainiert AlphaChip zunächst an verschiedenen Chip-Blöcken früherer Generationen, etwa On-Chip- und Chip-übergreifenden Netzwerkblöcken, Speichercontrollern und Datenübertragungspuffern (dies wird als Vortraining bezeichnet)
  • Anschließend wird AlphaChip auf aktuellen TPU-Blöcken ausgeführt, um hochwertige Layouts zu erzeugen
  • Anders als frühere Ansätze wird AlphaChip, ähnlich wie menschliche Experten, umso besser und schneller, je mehr Instanzen von Chip-Placement-Aufgaben es löst
  • Für jede neue TPU-Generation, einschließlich des neuesten Trillium (6. Generation), hat AlphaChip bessere Chip-Layouts entworfen und einen größeren Teil des gesamten Floorplans geliefert, wodurch der Designzyklus beschleunigt und leistungsfähigere Chips produziert wurden

Die breite Wirkung von AlphaChip

  • Die Wirkung von AlphaChip zeigt sich in Anwendungen bei Alphabet, in der Forschungsgemeinschaft und in der gesamten Chipdesign-Industrie
  • Über das Design spezialisierter KI-Beschleuniger wie TPU hinaus hat AlphaChip Layouts für andere Chips innerhalb von Alphabet erzeugt, etwa für den Axion-Prozessor, Googles ersten Arm-basierten Allzweck-Rechenzentrums-CPU
  • Auch externe Organisationen übernehmen AlphaChip und bauen darauf auf (zum Beispiel hat MediaTek, eines der weltweit führenden Chipdesign-Unternehmen, AlphaChip erweitert, um Energieverbrauch, Leistung und Chipfläche zu verbessern und gleichzeitig die Entwicklung seiner fortschrittlichsten Chips wie Dimensity Flagship 5G, das in Samsung-Smartphones eingesetzt wird, zu beschleunigen)
  • AlphaChip hat eine Explosion von KI-Arbeiten für das Chipdesign ausgelöst und wurde auf andere wichtige Schritte des Chipdesigns ausgeweitet, etwa Logiksynthese und Makroauswahl

Chips der Zukunft bauen

  • Wir glauben, dass AlphaChip das Potenzial hat, jeden Schritt des Chipdesign-Zyklus zu optimieren, von der Computerarchitektur bis zur Fertigung
  • Es könnte das Chipdesign für kundenspezifische Hardware in Alltagsgeräten revolutionieren, darunter Smartphones, medizinische Geräte und landwirtschaftliche Sensoren
  • Künftige Versionen von AlphaChip sind bereits in Entwicklung, und wir freuen uns darauf, gemeinsam mit der Community weiter in diesem Bereich zu innovieren und eine Zukunft zu schaffen, in der Chips schneller, günstiger und energieeffizienter sind

Meinung von GN⁺

  • AlphaChips KI-basierter Ansatz revolutioniert das Chipdesign. Insbesondere bei der Automatisierung des Chip-Layout-Designprozesses wurden große Fortschritte erzielt
  • AlphaChip ist eines der frühen Beispiele für den Einsatz von Reinforcement Learning bei realen Engineering-Problemen und ein gutes Beispiel dafür, wie KI in der realen Welt genutzt werden kann
  • Der Einfluss von AlphaChip auf das TPU-Design dürfte ein wichtiger Meilenstein für die Weiterentwicklung von KI-Beschleuniger-Hardware sein. Bessere KI-Beschleuniger werden leistungsfähigere KI-Modelle ermöglichen, was wiederum den Fortschritt der KI weiter beschleunigen wird
  • Eine übermäßige Abhängigkeit von KI-Design-Tools könnte jedoch zu einem Verlust an Fachwissen bei menschlichen Designern führen. Langfristig dürfte die Zusammenarbeit zwischen KI und menschlichen Experten am wünschenswertesten sein
  • Ähnliche KI-basierte Design-Tools sind etwa Cadence Cerebrus und Synopsys DSO.ai. Es ist zu erwarten, dass sich der Wettbewerb zwischen KI-basierten Design-Automatisierungstools künftig verschärfen wird

1 Kommentare

 
GN⁺ 2024-09-29
Hacker-News-Kommentare
  • Googles Nature-Artikel wurde von Forschern aus dem EDA/CAD-Bereich kritisiert
    • Erwiderungspaper von Google-internen Forschern: "Stronger Baselines for Evaluating Deep Reinforcement Learning in Chip Placement"
    • 2023-ISPD-Paper des UCSD-Teams: "Assessment of Reinforcement Learning for Macro Placement"
    • Kritisches Paper von Igor Markov: "The False Dawn: Reevaluating Google's Reinforcement Learning for Chip Macro Placement"
  • Googles RL-Algorithmus für Macro Placement wurde nicht fair mit anderen aktuellen Algorithmen verglichen
    • Es wird behauptet, bei der Makroplatzierung besser als Menschen zu sein, erreicht aber nicht die Leistung heutiger Mixed-Placement-Algorithmen
    • Die RL-Technik benötigt mehr Rechenressourcen als andere Algorithmen und lernt keine neue Darstellung des Platzierungsproblems selbst, sondern eine Ersatzfunktion
  • Skepsis gegenüber Googles Arbeit; dazu wurde ein ausführlicher Beitrag auf einer persönlichen Website verfasst
  • Es gibt Fälle, in denen Google-Forscher schikaniert wurden und deshalb zu Anthropic wechselten
    • Zugehöriger Artikel: "Google Brain AI Researcher Fired Tension"
  • TSMC betont, dass moderne Software zur Automatisierung des Chipdesigns in der Lage ist, Logikdesigns für TDP auszuwählen
    • Das könnte ein Weg sein, Dennard Scaling aufrechtzuerhalten
    • Die Lichtgeschwindigkeit und physische Nähe bleiben zwar wichtig, aber es stellt sich die Frage, wie viel Vorteil die Vermeidung von Thermal Throttling bringt
  • Frage danach, wie die Qualität von Chipdesign gemessen wird
    • Es stellt sich die Frage, ob die von Google gemeldeten Metriken sinnvoll sind oder nur dazu dienen, Google besser aussehen zu lassen
    • Die "Qualität" eines Chipdesigns ist vielschichtig und stark vom Anwendungsfall abhängig
    • Ein Chip für Rechenzentren und ein Chip für eine Smartphone-Kamera oder ein Auto werden sehr unterschiedlich aussehen
    • Es stellt sich die Frage, was in genau diesem Problem bzw. dieser Aufgabe "besser" bedeutet
  • Eurisco wurde früher für Place-and-Route-Aufgaben verwendet und lieferte sehr gute Ergebnisse
    • Eurisco wurde verwendet, um Kampfraumschiff-Flotten für das Spiel Traveler TCS zu entwerfen
    • Eurisco nutzte symmetriebasierte Platzierung, die es im VLSI-Design gelernt hatte
    • Es stellt sich die Frage, ob die Heuristiken von AlphaChip auch anderswo eingesetzt werden könnten
  • Googles Arbeit am Chipdesign ist "umstritten"
    • Es stellt sich die Frage, warum nur PR gemacht wird, statt wirklich etwas Neues zu leisten
  • Das Problem, dass viele DeepX-Paper bei Nature statt in geeigneten CS-Foren eingereicht werden
    • Wenn man im Chipdesign bessere Arbeit leistet, sollte man bei ISPD oder ISCA usw. einreichen
    • Es ist unklar, wie Nature mit solchen Papern umgeht
  • Es stellt sich die Frage, warum ständig der Ausdruck "übermenschlich" verwendet wird
    • Algorithmen werden für solche Aufgaben eingesetzt; Menschen platzieren nicht Billionen von Transistoren von Hand
  • Es wäre wünschenswert, Werkzeuge für PCB-Design/Layout zu haben
  • Es stellt sich die Frage, wie nah speicherbasiertes Computing daran ist, den Sprung von der Forschung zu wettbewerbsfähigen Produkten zu schaffen
    • Es wird angenommen, dass der Zeitpunkt gekommen ist, sehr offensiv in die Skalierung von Experimenten wie Memristoren zu investieren
    • Es wird darüber diskutiert, wie viele neue Reaktoren für AI-Rechenzentren benötigt werden