KI lernt die „schwarze Magie“ des RFIC-Designs
(spectrum.ieee.org)- RFICs bilden die Grundlage für Funktechnologien wie 5G, Automobilradar und Satellitenkommunikation, bleiben aber eine handarbeitslastige Herausforderung, weil Elektromagnetik, Wärmeverhalten und Packaging-Zuverlässigkeit gleichzeitig abgestimmt werden müssen
- Forschende aus Princeton nutzen keine menschlichen Design-Templates als Ausgangspunkt, sondern kombinieren Reinforcement Learning und inverses Design, um Architektur, Schaltungstopologie, Bauelementparameter und elektromagnetische Interfaces von Grund auf zu erkunden
- Ein KI-basierter Emulator sagt Streuparameter für beliebige zweidimensionale elektromagnetische Strukturen in Millisekunden voraus und reduziert damit die minuten- bis stundenlangen Iterationen klassischer elektromagnetischer Solver erheblich
- 2023 erzielte er bei einem 30–100-GHz-Millimeterwellen-Leistungsverstärker unter den damaligen siliziumbasierten Leistungsverstärkern die beste Kombination aus Bandbreite, Ausgangsleistung und Effizienz; 2024 erzeugte er auch Multiport-IC-Strukturen innerhalb von Minuten
- KI kann auch nicht funktionierende Schaltungen erzeugen, daher ist für die Verifikation menschliche Aufsicht nötig; für ein universelles Modell braucht es ein offenes Ökosystem, in dem unter NDAs gebundene RFIC- und Analogdesign-Daten geteilt werden können
Warum RFIC-Design „schwarze Magie“ geblieben ist
- RFICs sind Kernschaltungen, die Geräten das drahtlose Senden und Empfangen von Informationen ermöglichen; auch Fortschritte bei autonomen Fahrzeugen, Quantenkommunikation, 6G und Satellitenkommunikation hängen von weiterentwickelten RF-Chips ab
- CPU- und GPU-Design ist einer standardisierten Wissenschaft nähergekommen, RF-Design hat dagegen stark den Charakter einer handarbeitsbasierten Technik, die man durch jahrelange Erfahrung erlernt
- RFIC-Design umfasst mehrere physikalische Domänen gleichzeitig
- Maxwell-Gleichungen bestimmen, wie elektromagnetische Felder mit aktiven und passiven Bauelementen interagieren
- Thermodynamik bestimmt, wie im Betrieb Wärme entsteht und abgeführt wird
- Thermische Ausdehnung und Kontraktion hängen damit zusammen, ob Chip und Package bei Temperaturänderungen stabil bleiben
- Weil alle physikalischen Einschränkungen gemeinsam berücksichtigt werden müssen, ist der Designraum sehr groß, und häufig entstehen Trade-offs, bei denen die Verbesserung einer Leistungskennzahl eine andere verschlechtert
Klassischer RFIC-Designablauf und Engpässe
- Um einen 28-GHz-Leistungsverstärker für 5G-Millimeterwellen-Handsets zu entwerfen, müssen zuerst Schaltungsarchitektur und Topologie festgelegt werden
- Die RFIC-Architektur legt wie der Bauplan eines Hauses die benötigten Komponenten und Signalpfade fest
- Bei Leistungsverstärkern ist die Anzahl der Verstärkerstufen ein wichtiger Faktor
- Der Großteil der RFIC-Fläche wird nicht von Transistoren, sondern von passiven Bauelementen wie Induktoren und Übertragungsleitungen sowie von elektromagnetischen Strukturen belegt
- 5G-Signale arbeiten bei 28 GHz und 39 GHz, Satellitenkommunikation bei 26,5–40 GHz und darüber, Automobilradar bei 77 GHz; RFICs steuern bei solchen hohen Frequenzen die Signalenergie über präzise elektromagnetische Strukturen
- Wenn ein Signalpfad nicht richtig zur nächsten Komponente passt, entsteht ein Problem der Impedanzanpassung, bei dem Energie nicht nach vorne fließt, sondern nach hinten reflektiert wird
- Ingenieure entwerfen feine Übergangsstrukturen zwischen Komponenten, um Reflexionen zu reduzieren
- Diese Strukturen können nicht nur zur Signalübertragung, sondern auch zum Aufteilen, Kombinieren und Verteilen über mehrere Pfade genutzt werden
- Werden die Spezifikationen nicht erfüllt, müssen Topologie oder Architektur erneut geändert und Simulationen wiederholt werden; ein neues Chipdesign kann Jahre und zig Millionen bis Hunderte Millionen Dollar kosten
KI-Designansatz jenseits von Templates
- Bisherige Forschung nutzte Machine Learning zur Optimierung von Schaltungstemplates, stützte sich aber weiterhin auf von Menschen erstellte bestehende Designbibliotheken
- Ziel der Forschenden aus Princeton ist es, den Algorithmus ohne vorgefertigte Topologie alle Parameter der Architektur, der Teilschaltungen und der elektromagnetischen passiven Strukturen von Grund auf bestimmen zu lassen
- Dieser Ansatz unterscheidet sich im Ausgangspunkt von herkömmlicher Optimierung
- Der herkömmliche Ansatz passt Parameter wie Transistorgrößen oder Formen passiver Bauelemente in von Menschen entworfenen Strukturen an
- Der neue Ansatz erzeugt aus einem nahezu leeren Ausgangspunkt Kandidatenkombinationen von Schaltungen, kartiert Performance-Trade-offs und erkundet den Designraum
- Wie AlphaGo Zero entwickelt der Ansatz Designstrategien durch eigene Exploration und Bewertung, statt menschlichen Beispielen zu folgen
- Der Algorithmus lernt Schaltungen, Elektromagnetik und das gemeinsame Design dazwischen mit dem Ziel eines End-to-End-RFIC-Designs
Kombination aus Reinforcement Learning und inversem Design
- Der erste Schritt ist ein Reinforcement-Learning-Framework, das die optimale Systemarchitektur, Schaltungstopologie, Bauelementparameter und Eigenschaften der elektromagnetischen Interfaces bestimmt
- Der Reinforcement-Learning-Agent probiert wie ein Computer, der ein Spiel lernt, verschiedene Kombinationen aus, beobachtet den Zusammenhang zwischen Aktionen und Punktzahlen und findet so bessere Schaltungen
- Das Training dauert einige Tage bis eine Woche
- Nach Abschluss des Trainings kann er Schaltungen sehr schnell entwerfen
- Der zweite Schritt ist inverses Design, das die physische elektromagnetische Struktur findet, die die gewünschten Streuparameter erzeugt
- Streuparameter messen, ob ein Signal beim Eintritt in eine Komponente vorwärtsläuft oder nach hinten reflektiert wird
- Das ähnelt in der Tragwerksplanung der Suche nach Bögen oder Stützkonstruktionen, um einen Zielraum zu schaffen
- Inverses RFIC-Design muss den Schaltungsbetrieb und die elektromagnetische Antwort von Interconnects und passiven Bauelementen gleichzeitig abstimmen und lässt sich daher nur schwer durch iterative manuelle Suche lösen
Wie der KI-Emulator elektromagnetische Design-Iterationen reduziert
- Die Forschenden ersetzen den RF-Schaltungssimulator durch einen KI-basierten Emulator
- Dieses Modell nimmt beliebige zweidimensionale Strukturen als Eingabe und sagt Streuparameter voraus, ohne die Maxwell-Gleichungen direkt zu berechnen
- Aufgaben, für die klassische elektromagnetische Solver Minuten bis Stunden benötigten, reduziert es auf Millisekunden
- Der Emulator basiert auf einem Convolutional Neural Network, das bei der Bildverarbeitung stark ist
- Strukturbilder enthalten räumliche Informationen, aus denen sich die elektromagnetische Performance vorhersagen lässt
- Die Forschenden trainierten das Modell mit vielen zufälligen Pixelstrukturen, die mit Streuparametern gelabelt waren
- Durch die Kombination von Reinforcement-Learning-basiertem inversen Design und KI-Emulator entsteht ein End-to-End AI Designer, der auf das Design von Leistungsverstärkern angewendet wurde
RF-Architekturen mit anderen Ergebnissen als Menschen
- Der 2023 veröffentlichte Proof of Concept zielte auf Leistungsverstärker im 30–100-GHz-Millimeterwellenband
- Dieser Bereich umfasst die meisten relevanten 5G- und Radarfrequenzen
- Das finale Design bot unter den damaligen siliziumbasierten Leistungsverstärkern die beste Kombination aus wide bandwidth, output power und efficiency und hielt eine record efficiency
- Die erzeugten elektromagnetischen Pfade sahen nicht wie die regelmäßigen, symmetrischen Strukturen aus, die Menschen normalerweise in Betracht ziehen, sondern eher wie zufällige Muster oder QR-Codes
- Dieses Ergebnis zeigt, dass nicht garantiert ist, dass historisch verwendete Templates den heutigen Designzielen nahe am Optimum entsprechen
- Später erweiterten die Forschenden das Modell auf Strukturen mit vielen Ein- und Ausgangsports
- Zwei Ports bedeuten vier Streuparameter, vier Ports bereits 16, sodass die Komplexität schnell zunimmt
- In einer Studie zu Multiport Integrated Circuits aus dem Jahr 2024 zeigten sie, dass der KI-Algorithmus auch Multiport-Strukturen handhaben kann
- Früher waren für Multiport-Elektromagnetiksimulationen Tage oder Wochen nötig, dieses Modell entwickelt neue Strukturen innerhalb von Minuten weiter
- Durch die Kombination von Reinforcement-Learning-Framework und inversem Design zeigten sie einen Ablauf, der von der Spezifikation bis zum fabrication-ready layout führt; angewendet wurde er auf Low-Noise Amplifier, Subterahertz und breitbandige Power Amplifiers
Interpretierbares KI-Design
- RFIC-Tests und Debugging können genauso lange dauern wie das Design selbst oder noch schwieriger sein; Ingenieure bevorzugen daher interpretierbare Strukturen, die sie bei Problemen verstehen und reparieren können
- Die Forschenden wenden Diffusion Models, wie sie in bildgenerierender KI genutzt werden, auf die Erzeugung von RFIC-Strukturen an
- Statt Text-Prompts nutzen sie Streuparameter als Eingabe und erzeugen als Ausgabe die elektromagnetische Struktur des RFIC
- Ein Spatial-Frequency-Regler in der Eingabe ermöglicht es Designern, die Form der resultierenden Struktur zu steuern
- Niedrige räumliche Frequenz: klassische und interpretierbare Form
- Mittlere räumliche Frequenz: labyrinthartige Struktur
- Hohe räumliche Frequenz: pixelisierte oder nahezu zufällige Struktur
- Der gesamte Prozess vom Prompt bis zur Ausgabe dauert etwa 6 Minuten; sofern die Streuparameter physikalisch unter den Maxwell-Gleichungen realisierbar sind, kann eine entsprechende Struktur erzeugt werden
Verbleibende Grenzen und Datenherausforderungen
- KI-basierte Designmethoden haben in der RF-Community Aufmerksamkeit gewonnen und beginnen, den traditionellen Bottom-up-Designablauf umzudrehen
- Es bleiben noch ungelöste Fragen
- Wie gut sich die Methode verallgemeinern lässt
- Ob sie dauerhaft hohe Performance liefern kann
- Ob alle möglichen Trade-offs ganzheitlich optimiert werden können
- Ob sie über RFICs hinaus auch andere Schaltungen erfinden kann, die Menschen nie gebaut haben
- KI kann Halluzinationen erzeugen, also schlechte, nicht funktionierende Schaltungen; für die Verifikation bleibt daher menschliche Aufsicht nötig
- Um ein universelles Foundational Model zu bauen, werden große Datenmengen benötigt, aus denen sich die bestimmenden Gesetze von Elektromagnetik und Schaltungsbetrieb lernen lassen
- ImageNet ist ein Beispiel dafür, wie 14 Millionen vielfältige, von Menschen gelabelte Bilder die Generalisierung von Bilderkennungsmodellen ermöglichten
- Auch im RFIC- und Analogdesign sind Daten in ähnlichem Umfang und ähnlicher Vielfalt nötig
- Viele Daten existieren in Simulationen von Unternehmen und Forschungslaboren auf der ganzen Welt, sind aber größtenteils hinter NDAs gebunden
- Natcast betrieb das R&D-Programm des U.S. CHIPS and Science Act und hätte geteilte Infrastruktur und Innovation für drahtlose Technologien der nächsten Generation, Sensorik und Verteidigung stärken können, doch die Organisation und das mit Machine Learning und RFIC verbundene Programm wurden beendet
- Wenn das RFIC-Feld die Zusammenarbeit zwischen KI-Forschenden und Chipdesignern ausweitet und ein offenes Ökosystem aufbaut, kann es das Potenzial KI-basierter IC-Designs besser ausschöpfen
1 Kommentare
Meinungen auf Hacker News
Erinnert mich an die frühere Suche mit genetischen Algorithmen. Der Ansatz aus Vermuten und Verifizieren kann ziemlich mächtig sein, besonders wenn man zwischendurch noch die Anleitung eines Agenten einbauen kann.
https://en.wikipedia.org/wiki/Evolved_antenna
Als Einstieg: https://sci-hub.ru/storage/moscow/4324/11d145b2c2c3ab320f70b...
Ich frage mich, ob die verbreitete Erwartung, dass eine wahre Theorie irgendwo schön und elegant sein muss, noch ein weiteres Jahrhundert übersteht. Was, wenn reale Naturphänomene tatsächlich am besten durch einen furchtbar chaotischen Haufen Gleichungen beschrieben werden, den nur Maschinen handhaben und daraus Schlüsse ziehen können? Das wäre ziemlich traurig.
Der Witz, dass Physiker von einer „perfekt kugelförmigen Kuh“ ausgehen, gehört in diesen Kontext, und eigentlich liegt auch der Kern des Essays über die „unvernünftige Effektivität der Mathematik“ nahe daran. Es geht darum, dass es irrational erstaunlich ist, wie gut mathematische Näherungen die Welt beschreiben.
Ockhams Rasiermesser ist eine nützliche Heuristik, aber es verzerrt uns auch in Richtung der einfacheren Erklärung.
Eine hervorragende Nutzung von KI-Design ist Patentverschmutzung. Man kann mit KI massenhaft Designvarianten erzeugen und auf einer Website veröffentlichen; wenn später ein Patent auftaucht, lassen sich Überschneidungen nutzen, um es für ungültig zu erklären oder zumindest seinen Umfang einzugrenzen. Denn die Verallgemeinerung eines Patents wird durch den Stand der Technik begrenzt.
Später erklärte er seine Logik bei einer lokalen TEDx-Veranstaltung und bekam damit eine gewisse Aufmerksamkeit [1]; soweit ich mich erinnere, reagierten juristische Kommentatoren eher gelassen und meinten, Richter zögen im Alltag weit feinere Unterscheidungen als diese. Trotzdem ein netter Versuch.
[0] https://allthemusic.info/
[1] https://m.youtube.com/watch?v=sJtm0MoOgiU and
https://www.the-independent.com/tech/music-copyright-algorit...
Das ist etwas frustrierend. KI kann vieles leisten, aber indem man LLMs mit Monte Carlo, genetischen Algorithmen, Expertensystemen und anderer statistischer Magie der klassischen Machine Learning ständig vermischt, werden längst etablierte, moralisch neutrale Machine-Learning-Aktivitäten und die Bedenken gegenüber LLMs und Stable Diffusion viel zu aggressiv in einen Topf geworfen.
Und vielleicht ist genau das auch beabsichtigt.
Wenn man sagen will, dass es bei irgendetwas große Fortschritte gibt, ist die Verknüpfung mit dem populärwissenschaftlichen Verständnis, dass Science-Fiction menschliche Errungenschaften vorhersage, ein Ansatz mit wenig Aufwand und großer Wirkung. Wenn oberste Priorität ist, Leute zu begeistern, geht es nicht darum, präzise zu kommunizieren.
Die Aussage „Menschen hätten sich das nicht einmal vorstellen können“ wirkt übertrieben. Trotzdem scheint es durchaus möglich, dass Machine-Learning-Algorithmen per Brute-Force-Suche zu Chip-Designs gelangen können, die noch niemand ausprobiert hat, und dass einige davon für uns nützlich sein können. Für einen Computer ist das eine ziemlich vernünftige Aufgabe.
Eine Sache, die man aus dem Artikel mitnehmen kann, ist, dass man die bewährten Grundbausteine des Chip-Designs aufgeben musste, um solche Fortschritte zu erzielen. Ich frage mich, ob dasselbe auch für normales Coding gilt. Werden die erstaunlichen Innovationen beim AI-Coding in Wirklichkeit durch Rust und Python ausgebremst? Sollten wir AI-Tools einfach auf möglichst niedriger Ebene coden lassen?
Das erinnert mich an diesen alten Artikel: https://www.damninteresting.com/on-the-origin-of-circuits/
Einer dieser kleinen Schätze, die man im Internet findet.
In einem anderen Kommentar in der Nähe ging es um die Robustheit von im Labor gezüchteten Designs; der interessanteste Teil des Damn-Interesting-Artikels war für mich ebenfalls, dass das evolvierte Programm untrennbar mit dem einen physischen FPGA verbunden war, der fürs Training verwendet wurde. Dieses RFIC-Lernmodell nutzt einen Simulator, daher frage ich mich, ob die Eigenschaften der physischen Hardware, auf der der Simulator läuft, beim Training ausreichend isoliert sind, sodass die Designs ähnlich funktionieren, wenn man den Simulator auf anderer Hardware ausführt.
Die offensichtlichere Frage ist, ob ein im Simulator evolviertes Design überhaupt eine Chance hat, auf echter physischer Hardware wie erwartet zu funktionieren. Mein Bauchgefühl dazu ist eher nein, aber es wirkt trotzdem wie interessante Forschung, und ich denke oft, dass ein echtes Verständnis dessen, was im FPGA tatsächlich passiert ist, vielleicht eine Voraussetzung dafür ist, Reinforcement Learning wirklich in den Griff zu bekommen.
Schön, dass du diesen Artikel gepostet hast; wenn du noch andere Favoriten zu diesem Themenfeld hast, schick sie gern rüber.
Die größte Frage ist, wie robust solche Designs sind.
Das Paper zeigt zwar, dass die Messwerte realer Geräte gut zu den Vorhersagen passen, aber ich habe im Text keine Stelle gefunden, die das ausdrücklich behandelt. Außerdem enthalten einige der vorgestellten Systeme traditionell entworfene Subblöcke, die möglicherweise einen Teil der Arbeit übernehmen.
Vielleicht bin ich auch nur voreingenommen, weil es nach meinem Job greift, oder vielleicht wollen sie, dass wir genau das denken.
Meiner Ansicht nach gewinnen in der Praxis einfache Ideen, die Fertigungs- und Umweltschwankungen sowie Modellgrenzen überstehen. Dinge wie Feedback oder Symmetrie. Was hier gezeigt wird, ist aber eher das Gegenteil. Ich habe ein paar Mal Schaltungsparameter blind optimiert, und am Ende ergab alles völlig Sinn, sobald ich die einfache Idee erkannt hatte, die mir entgangen war, etwa „hier braucht es Symmetrie“ oder „hier braucht es mehr Bandbreite“. Deshalb frage ich mich, ob sich durch das Anpassen von nur ein paar Pixeln dieser Struktur etwas Einfacheres offenbaren würde.
Und natürlich muss pflichtgemäß auch die „evolvierte Antenne“ erwähnt werden.
Dem Text zufolge besteht die Rolle der AI darin, im Optimierungsprozess den elektromagnetischen Simulator zu ersetzen und das Verhalten der Struktur abzuschätzen; das sei um mehrere Größenordnungen schneller als Simulation.
Das klingt plausibel, aber um das zu glauben, würde ich gern den Unterschied zwischen AI-Schätzung und realer Messung für Geometrien sehen, die sich deutlich von denen unterscheiden, die fürs AI-Training verwendet wurden. Außerdem müsste man sehen, mit welchem Simulator genau die Geschwindigkeit des AI-Modells verglichen wurde.
Für elektromagnetische Felder und elektronische Schaltungen gibt es verschiedene Simulationsansätze, die Genauigkeit gegen Geschwindigkeit eintauschen. Deshalb bin ich nicht überzeugt, dass AI-Inferenz zwangsläufig deutlich weniger Zeit benötigt als eine schnellere Simulation mit niedrigerer Genauigkeit. Auch so eine Simulation könnte genauer und verlässlicher sein als eine AI-Schätzung.
Da du sie schon genannt hast, noch ein Zusatz zu der Bemerkung, dass man „eine ziemlich einfache Idee erkennt“: Einer der großen Vorteile dieses computerunterstützten Designs ist meiner Ansicht nach „innovization“[1]. Ein etwas sperriger Begriff, aber der Kern ist, dass solche Systeme zu einem tieferen Verständnis eines bestimmten Prozesses führen. Wenn man es selbst erlebt, fühlt sich das ziemlich spannend an.
[1]: https://dl.acm.org/doi/10.1145/1143997.1144266
Die in diesem Artikel beschriebenen Methoden sind nicht neu. Wissenschaftler entwerfen seit Jahrzehnten mit genetischen Algorithmen Antennen, die niemand versteht, die aber gut funktionieren.
So magisch ist das nicht. Wie der Artikel selbst sagt, ist RFIC-Design weit über normales RF-Engineering hinaus eher schwarze Magie, die stark auf Wissen und Erfahrung des Designers angewiesen ist, unterstützt von Modellierungs- und Design-Tools, die vor ein paar Jahrzehnten noch Supercomputer-Niveau gehabt hätten.
Was AI tun kann, ist, alle möglichen Ergebnisse breitensuchartig zu durchsuchen und dann das mit der besten Performance auszuwählen. Das ist anders als ein Mensch, der sagt: „Dieser Weg sieht vielversprechend aus, graben wir dort tiefer.“