Teslas Ausbau der AI-Kapazität – H100, Dojo D1, D2, HW 4.0, X.AI und Cloud-Service-Provider

xguru · 2023-07-04T10:47:01+09:00

Tesla will zu einem der weltweit führenden AI-Unternehmen werden Natürlich hat Tesla weder das beste autonome Fahren geliefert, noch ist das Unternehmen in der Welt der generativen AI besonders sichtbar, aber … Tesla verfügt derzeit intern über eine kleine eigene AI-Infrastruktur im Umfang von 4.000 V100 und 16.000 A100 Microsoft und Meta besitzen mehr als 100.000 GPUs und arbeiten daran, diese Zahl zu verdoppeln Teslas schwache AI-Infrastruktur ist teilweise auf Verzögerungen beim internen D1-Trainingschip zurückzuführen Das ändert sich jetzt jedoch schnell Tesla vergrößert seine AI-Kapazität innerhalb von 1,5 Jahren um mehr als das Zehnfache Ein Teil davon ist für eigene Funktionen gedacht, ein Teil jedoch auch für X.AI Tesla entwirft seit 2016 eigene AI-Chips für Fahrzeuge und seit 2018 auch für Rechenzentren Bisher konnte keine Produktion erfolgen, doch 2023 wird die Fertigung hochgefahren Diese Architektur passt zu Teslas speziellen Anwendungsfällen, ist für LLMs jedoch nicht nützlich, da sie auf Bildnetzwerke fokussiert ist Tesla HW 4.0, FSD-Chip der 2. Generation Der Chip, der im Tesla-Fahrzeug AI-Inferenz ausführt, wird FSD-Chip genannt Tesla glaubt, dass für vollständig autonomes Fahren im Auto keine enorme Rechenleistung nötig ist, daher ist die Leistung des verbauten Chips stark begrenzt Außerdem verkauft Tesla in großen Stückzahlen und unterliegt daher deutlich strengeren Kostenbeschränkungen als Waymo/Cruise Waymo/Cruise nutzten bei Entwicklung und frühen Tests vollwertige GPUs, die mehr als zehnmal so teuer waren, und entwickeln schnellere und teurere SoCs Die Chips der 2. Generation werden in Fahrzeugen eingesetzt, die seit Februar 2023 verkauft werden Die 1. Generation basierte auf Samsungs 14nm-Prozess und bestand aus 12 Arm Cortex-A72 (2,2 GHz), organisiert in 3 Quad-Core-Clustern Die 2. Generation besteht aus 20 Arm Cortex-A72, organisiert in 5 Quad-Core-Clustern Der wichtigste Teil der 2. Generation sind drei NPU-Kerne Die 3 Kerne verwenden jeweils 32 MiB SRAM zur Speicherung von Modellgewichten und Aktivierungen In jedem Zyklus werden 256 Byte Aktivierungsdaten und 128 Byte Gewichtsdaten aus dem SRAM in die MACs (Multiply Accumulate Units) gelesen Die MACs sind als Grid ausgelegt; jeder NPU-Kern besitzt ein 96x96-Grid mit insgesamt 9.216 MACs und kann pro Taktzyklus 18.432 Operationen ausführen Bei 2,2 GHz ergibt sich für die NPU eine Rechenleistung von 121,641 TOPS (trillion operations per second) Der FSD-Chip der 2. Generation ist mit 256 GB NVMe-Storage und 16 GB Micron DDR6 (14 Gbps) auf einem 128-Bit-Speicherbus mit 224 GB/s Bandbreite ausgestattet Die Bandbreite ist damit 3,3x höher als bei der 1. Generation HW 4.0 enthält zwei FSD-Chips Durch die Leistungssteigerung des HW4-Boards steigt auch der Stromverbrauch auf das Doppelte von HW3 Trotz der Leistungssteigerung von HW4 möchte Tesla FSD auch auf HW3 unterstützen, damit bestehende HW3-Nutzer, die FSD gekauft haben, kein Retrofit benötigen Das Infotainment-System nutzt eine AMD-GPU/APU. Sie befindet sich auf derselben Platine wie der FSD-Chip, während sie früher auf einer separaten Daughterboard saß Die HW4-Plattform unterstützt 12 Kameras. Eine dient der Redundanz, 11 werden tatsächlich verwendet Früher wurden im Frontkamera-Hub drei Kameras mit niedriger Auflösung von 1,2 Megapixeln verwendet, die neue Plattform nutzt zwei 5-Megapixel-Kameras Tesla verwendet derzeit keine anderen Sensoren außer LIDAR und Kameras Früher wurde Radar genutzt, doch ab einer mittleren Generation wurde es entfernt Dadurch konnten die Fahrzeugherstellungskosten deutlich gesenkt werden; Tesla glaubt, dass autonomes Fahren nur mit Kameras möglich ist, und optimiert entsprechend Tesla hat allerdings gesagt, dass ein brauchbares Radar, falls verfügbar, in das Kamerasystem integriert würde Die HW4-Plattform soll mit einem selbst entwickelten Radar namens Phoenix ausgestattet werden Phoenix soll Radar- und Kamerasystem kombinieren, um mehr Daten zu nutzen und sicherere Fahrzeuge zu schaffen Das Phoenix-Radar nutzt das 76–77-GHz-Spektrum Es ist ein nicht gepulstes Automotive-Radarsystem mit Unterstützung für drei Erfassungsmodi Differenzierung von Teslas AI-Modellen Tesla will Foundation-AI-Modelle entwickeln, die autonome Roboter und Fahrzeuge antreiben Beide müssen ihre Umgebung wahrnehmen und sich darin bewegen, daher lassen sich auf beide derselbe Typ von AI-Modellen anwenden Die Inferenz dieser Modelle erfordert niedrigen Stromverbrauch und geringe Latenz, weshalb Hardwarebeschränkungen die maximale Modellgröße, die Tesla anbieten kann, stark begrenzen Unter allen Unternehmen verfügt Tesla über den größten Datensatz, der für Deep-Learning-Neuronennetze nutzbar ist Jedes Auto auf der Straße erfasst mit Sensoren und Bildern Daten; multipliziert mit der Zahl der Tesla-Elektrofahrzeuge auf den Straßen ergibt das einen enormen Datensatz Tesla nennt diese Datenerfassung "Fleet Scale Auto Labeling" Jedes Tesla-Elektrofahrzeug nimmt 45- bis 60-sekündige Log-Clips mit dichtem Sensordatenmaterial auf, darunter Video, interne IMU-Daten (Inertial Measurement Unit), GPS und Fahrleistung, und sendet sie an Teslas Trainingsserver Tesla verwendet nur einen sehr kleinen Teil der gesammelten Daten Tesla ist dafür bekannt, seine Modelle wegen der Inferenzbeschränkungen stark zu übertrainieren, um innerhalb einer vorgegebenen Modellgröße die bestmögliche Genauigkeit zu erreichen

(semianalysis.com)

9 Punkte von xguru 2023-07-04 | 3 Kommentare | Auf WhatsApp teilen

Tesla will zu einem der weltweit führenden AI-Unternehmen werden
Natürlich hat Tesla weder das beste autonome Fahren geliefert, noch ist das Unternehmen in der Welt der generativen AI besonders sichtbar, aber …
Tesla verfügt derzeit intern über eine kleine eigene AI-Infrastruktur im Umfang von 4.000 V100 und 16.000 A100
- Microsoft und Meta besitzen mehr als 100.000 GPUs und arbeiten daran, diese Zahl zu verdoppeln
Teslas schwache AI-Infrastruktur ist teilweise auf Verzögerungen beim internen D1-Trainingschip zurückzuführen
Das ändert sich jetzt jedoch schnell
Tesla vergrößert seine AI-Kapazität innerhalb von 1,5 Jahren um mehr als das Zehnfache
Ein Teil davon ist für eigene Funktionen gedacht, ein Teil jedoch auch für X.AI
Tesla entwirft seit 2016 eigene AI-Chips für Fahrzeuge und seit 2018 auch für Rechenzentren
Bisher konnte keine Produktion erfolgen, doch 2023 wird die Fertigung hochgefahren
Diese Architektur passt zu Teslas speziellen Anwendungsfällen, ist für LLMs jedoch nicht nützlich, da sie auf Bildnetzwerke fokussiert ist

Tesla HW 4.0, FSD-Chip der 2. Generation

Der Chip, der im Tesla-Fahrzeug AI-Inferenz ausführt, wird FSD-Chip genannt
Tesla glaubt, dass für vollständig autonomes Fahren im Auto keine enorme Rechenleistung nötig ist, daher ist die Leistung des verbauten Chips stark begrenzt
Außerdem verkauft Tesla in großen Stückzahlen und unterliegt daher deutlich strengeren Kostenbeschränkungen als Waymo/Cruise
Waymo/Cruise nutzten bei Entwicklung und frühen Tests vollwertige GPUs, die mehr als zehnmal so teuer waren, und entwickeln schnellere und teurere SoCs
Die Chips der 2. Generation werden in Fahrzeugen eingesetzt, die seit Februar 2023 verkauft werden
Die 1. Generation basierte auf Samsungs 14nm-Prozess und bestand aus 12 Arm Cortex-A72 (2,2 GHz), organisiert in 3 Quad-Core-Clustern
Die 2. Generation besteht aus 20 Arm Cortex-A72, organisiert in 5 Quad-Core-Clustern
Der wichtigste Teil der 2. Generation sind drei NPU-Kerne
- Die 3 Kerne verwenden jeweils 32 MiB SRAM zur Speicherung von Modellgewichten und Aktivierungen
- In jedem Zyklus werden 256 Byte Aktivierungsdaten und 128 Byte Gewichtsdaten aus dem SRAM in die MACs (Multiply Accumulate Units) gelesen
- Die MACs sind als Grid ausgelegt; jeder NPU-Kern besitzt ein 96x96-Grid mit insgesamt 9.216 MACs und kann pro Taktzyklus 18.432 Operationen ausführen
- Bei 2,2 GHz ergibt sich für die NPU eine Rechenleistung von 121,641 TOPS (trillion operations per second)
Der FSD-Chip der 2. Generation ist mit 256 GB NVMe-Storage und 16 GB Micron DDR6 (14 Gbps) auf einem 128-Bit-Speicherbus mit 224 GB/s Bandbreite ausgestattet
- Die Bandbreite ist damit 3,3x höher als bei der 1. Generation
HW 4.0 enthält zwei FSD-Chips
Durch die Leistungssteigerung des HW4-Boards steigt auch der Stromverbrauch auf das Doppelte von HW3
Trotz der Leistungssteigerung von HW4 möchte Tesla FSD auch auf HW3 unterstützen, damit bestehende HW3-Nutzer, die FSD gekauft haben, kein Retrofit benötigen
Das Infotainment-System nutzt eine AMD-GPU/APU. Sie befindet sich auf derselben Platine wie der FSD-Chip, während sie früher auf einer separaten Daughterboard saß
Die HW4-Plattform unterstützt 12 Kameras. Eine dient der Redundanz, 11 werden tatsächlich verwendet
- Früher wurden im Frontkamera-Hub drei Kameras mit niedriger Auflösung von 1,2 Megapixeln verwendet, die neue Plattform nutzt zwei 5-Megapixel-Kameras
Tesla verwendet derzeit keine anderen Sensoren außer LIDAR und Kameras
Früher wurde Radar genutzt, doch ab einer mittleren Generation wurde es entfernt
- Dadurch konnten die Fahrzeugherstellungskosten deutlich gesenkt werden; Tesla glaubt, dass autonomes Fahren nur mit Kameras möglich ist, und optimiert entsprechend
- Tesla hat allerdings gesagt, dass ein brauchbares Radar, falls verfügbar, in das Kamerasystem integriert würde
Die HW4-Plattform soll mit einem selbst entwickelten Radar namens Phoenix ausgestattet werden
- Phoenix soll Radar- und Kamerasystem kombinieren, um mehr Daten zu nutzen und sicherere Fahrzeuge zu schaffen
- Das Phoenix-Radar nutzt das 76–77-GHz-Spektrum
- Es ist ein nicht gepulstes Automotive-Radarsystem mit Unterstützung für drei Erfassungsmodi

Differenzierung von Teslas AI-Modellen

Tesla will Foundation-AI-Modelle entwickeln, die autonome Roboter und Fahrzeuge antreiben
Beide müssen ihre Umgebung wahrnehmen und sich darin bewegen, daher lassen sich auf beide derselbe Typ von AI-Modellen anwenden
Die Inferenz dieser Modelle erfordert niedrigen Stromverbrauch und geringe Latenz, weshalb Hardwarebeschränkungen die maximale Modellgröße, die Tesla anbieten kann, stark begrenzen
Unter allen Unternehmen verfügt Tesla über den größten Datensatz, der für Deep-Learning-Neuronennetze nutzbar ist
Jedes Auto auf der Straße erfasst mit Sensoren und Bildern Daten; multipliziert mit der Zahl der Tesla-Elektrofahrzeuge auf den Straßen ergibt das einen enormen Datensatz
Tesla nennt diese Datenerfassung "Fleet Scale Auto Labeling"
Jedes Tesla-Elektrofahrzeug nimmt 45- bis 60-sekündige Log-Clips mit dichtem Sensordatenmaterial auf, darunter Video, interne IMU-Daten (Inertial Measurement Unit), GPS und Fahrleistung, und sendet sie an Teslas Trainingsserver
Tesla verwendet nur einen sehr kleinen Teil der gesammelten Daten
- Tesla ist dafür bekannt, seine Modelle wegen der Inferenzbeschränkungen stark zu übertrainieren, um innerhalb einer vorgegebenen Modellgröße die bestmögliche Genauigkeit zu erreichen

3 Kommentare

wkwnqlw 2023-07-05

Tesla bietet seine autonome Fahrsoftware bereits seit zwei Jahren als Beta an. Ab der nächsten Version soll sie offiziell veröffentlicht werden.
Die erste Version war noch sehr unzureichend, doch immer mehr Menschen sagen, dass die derzeit angebotene Software inzwischen das Niveau eines durchschnittlichen Menschen übertroffen hat. Aktuell hat Teslas autonome Fahrsoftware (FSD) eine etwa dreimal niedrigere Unfallrate als Menschen.

bbongcol 2023-07-04

Es gibt wohl einen Tippfehler bei „1832 Operationen pro Taktzyklus“. Im Original steht 18.432 Operationen.

xguru 2023-07-04

Da es sich um einen Bezahlartikel handelt, ist der hintere Teil nicht sichtbar, aber schon der Anfang ist interessant genug, dass ich ihn hier einmal übertrage.

Teslas Ausbau der AI-Kapazität – H100, Dojo D1, D2, HW 4.0, X.AI und Cloud-Service-Provider

Tesla HW 4.0, FSD-Chip der 2. Generation

Differenzierung von Teslas AI-Modellen

Verwandte Beiträge

3 Kommentare