2 Punkte von GN⁺ 4 시간 전 | 1 Kommentare | Auf WhatsApp teilen
  • xAI hat in den vergangenen Wochen nacheinander Verträge abgeschlossen, um große GPU-Kapazitäten an Anthropic und Google zu vermieten, und wandelt sich damit eher von einem Modellentwickler zu einem Infrastruktur-Vermieter
  • Im Februar fusionierte xAI mit SpaceX, wodurch die Mieteinnahmen direkt in die Gesellschaft fließen, die bald an die Börse gehen könnte
  • Für Anthropic liegt das Volumen bei 1,25 Mrd. $/Monat für 300 MW (rund 220.000 GPUs), für Google bei 920 Mio. $/Monat für 110.000 GPUs; bei einer Laufzeit von 18 Monaten könnten so die gesamten Baukosten von rund 40 Mrd. $ zurückverdient werden
  • Akuter GPU-Mangel und die Fähigkeit von SpaceX/xAI, Rechenzentren schnell zu bauen, wirken als echter Wettbewerbsvorteil dieser Verträge
  • Da Kapazität, die für das eigene Modell Grok gedacht war, direkt an Wettbewerber vermietet wird, hängen ein möglicher Rückzug aus dem Wettbewerb der Frontier-Labore und der Erfolg oder Misserfolg des größten IPOs in Nordamerikas Geschichte zusammen

Vertragsstruktur und Hintergrund der SpaceX-Fusion

  • xAI hat kürzlich Partnerschaften mit Anthropic und Google zur Bereitstellung großer GPU-Kapazitäten geschlossen
  • Im Februar fusionierte xAI mit SpaceX, sodass die Erlöse aus diesen Verträgen direkt in die Gesellschaft vor dem Börsengang fließen
  • Es wird über mögliches Financial Engineering im Vorfeld des SpaceX-IPO spekuliert, doch es gibt Aspekte, die über bloße Bilanztechnik hinausgehen

Anthropics Kapazitätsproblem

  • Besonders bei Claude kam es zu schweren Kapazitätsengpässen am frühen Nachmittag in Europa und am Vormittag in den USA
    • Das ist das Zeitfenster, in dem europäische und amerikanische Nutzer gleichzeitig arbeiten und am stärksten um Kapazität konkurrieren
  • Anthropic führte in seinem Abo-Modell Beschränkungen zu Spitzenzeiten ein
    • Nutzung zwischen 5 und 11 Uhr PT bzw. 13 bis 19 Uhr GMT verbraucht dabei mehr vom Nutzungslimit
    • Ziel ist eine Glättung von Spitzen- und Nebenzeiten in der Nachfrage
  • Bei schnell wachsender Nachfrage stößt eine bloße Verschiebung der Nutzung jedoch an Grenzen, sodass zusätzliche Nutzungsbeschränkungen unvermeidlich wurden
    • Das ist keine wünschenswerte Situation, während Google und OpenAI um Kunden konkurrieren
    Anzeige

xAIs Lieferverträge für Kapazität

  • Anfang Mai kündigte xAI an, Anthropic Zugang zum älteren Rechenzentrum Colossus 1 in Memphis zu geben
    • Dadurch konnte Anthropic die Abo-Nutzungsbeschränkungen zurücknehmen; die Dienststabilität bleibt zwar unzureichend, doch die Engpässe zu Spitzenzeiten wurden vorübergehend gemildert
  • Das Anthropic-Abkommen wuchs auf 300 MW Kapazität für bis zu 1,25 Mrd. $ pro Monat, was rund 220.000 GPUs entspricht
  • Vergangene Woche kündigte auch Google eine ähnliche Partnerschaft an: 110.000 GPUs für 920 Mio. $ pro Monat
  • Beide Verträge enthalten Kündigungsklauseln
    • Nach einer anfänglichen Lock-in-Phase können beide Seiten mit 90 Tagen Vorankündigung kündigen

Analyse der Profitabilität

  • Auf den ersten Blick sind das für xAI Verträge mit sehr hoher Profitabilität
    • Bei 18 Monaten Laufzeit könnten die gesamten Baukosten (Capex) von rund 40 Mrd. $ zurückverdient werden, während xAI weiterhin GPUs im Umfang von mehreren hundert MW behalten würde
    • Opex und Abschreibungen sind dabei allerdings nicht eingerechnet
    Anzeige
  • Mittel- bis langfristig dürfte der Compute-Mangel anhalten, sodass selbst ältere H100 auch nach 18 Monaten noch sehr nützlich sein dürften
  • Schätzung der Stromkosten (Opex)

    • Bei Volllast von 300 MW läge der Verbrauch bei rund 2,6 Mrd. kWh pro Jahr
    • Beim günstigen Industriestrom in Tennessee (etwa 6 Cent/kWh) würden bei Netzbezug rund 160 Mio. $ pro Jahr anfallen
    • Colossus wird jedoch überwiegend mit eigenen Gasturbinen vor Ort betrieben; bei einem thermischen Wirkungsgrad im Simple-Cycle-Betrieb von ~10.000 Btu/kWh und Henry-Hub-Gaspreisen von ~3,50 $/MMBtu lägen die Brennstoffkosten mit rund 90 Mio. $ pro Jahr noch niedriger
    • Verglichen mit den rund 15 Mrd. $ pro Jahr, die Anthropic für 300 MW zahlt, macht Strom damit nur etwa 1 % des Umsatzes aus

Einwände gegen die Verträge (red flags)

  • Elon Musk und OpenAI befinden sich in einem heftigen Rechtsstreit, weshalb der Anthropic-Vertrag eher dazu dienen könnte, Druck auf OpenAI auszuüben, als primär kommerziellen Nutzen zu stiften
  • Google ist ein wichtiger Anteilseigner von SpaceX, wodurch ein Anreiz zur Stützung der IPO-Bewertung besteht
  • Dennoch ist entscheidend, dass GPUs im großen Stil Mangelware sind
    • Hinter dem Capex-Boom bei Rechenzentren steht die Tatsache, dass alle Betreiber bei ihren Zeitplänen deutlich zurückliegen
    • Selbst OpenAIs wichtigstes Rechenzentrum Stargate UAE ist durch den aktuellen Iran-Konflikt direkt bedroht; iranische Drohnen haben bereits ein anderes Rechenzentrum in den VAE getroffen

Bauvorteil von SpaceX/xAI

  • SpaceX/xAI ist außergewöhnlich gut darin, Rechenzentren termingerecht zu bauen
    • Das erste Colossus 1 wurde in nur 122 Tagen errichtet
    Anzeige
  • Musks Firmenverbund hat große Stärken darin, groß angelegte Infrastrukturprojekte schnell zu planen, zu bauen und umzusetzen
  • Auch Hyperscaler haben Erfahrung, bauen aber in einem weniger dringlichen Umfeld; gewöhnliche Projekte dauern dort oft Jahre
    • Erst in den vergangenen Jahren hat Capex dort richtig Fahrt aufgenommen, viele Projekte sollen erst in einigen Jahren fertig werden
  • Das ist ein bedeutender Wettbewerbsvorteil von xAI, den man nicht leichtfertig abtun sollte

Die Position von Grok

  • Ein erheblicher Teil der Rechenzentrumskapazität, die für Training und Inferenz von Grok vorgesehen war, wird direkt an Wettbewerber vermietet, was Grok in eine unklare Lage bringt
  • Das wirkt wie ein klarer Rückzug aus dem Wettbewerb der Frontier-Labore
    • Möglich ist allerdings auch, dass der Rechenzentrumsbedarf zu hoch angesetzt wurde und die Inferenznachfrage nach dem Grok-Modell deutlich unter den Prognosen liegt, sodass freie Kapazität monetarisiert wird
    • Der Vertrag zwischen xAI und Cursor macht die Lage noch komplizierter
  • Financial Engineering, massiver Compute-Mangel und ein Wettbewerbsvorteil beim Bau von Rechenzentren sind alle drei bis zu einem gewissen Grad real
    • Wie stark jeder dieser Faktoren ins Gewicht fällt, wird über Erfolg oder Misserfolg des größten IPOs in der Geschichte Nordamerikas entscheiden
  • Insgesamt wirkt xAI weniger wie ein Frontier-Labor mit angehängtem Rechenzentrumsgeschäft, sondern eher wie ein Rechenzentrums-REIT mit angehängtem Frontier-Labor

1 Kommentare

 
GN⁺ 4 시간 전
Hacker-News-Kommentare
  • Google hält 5–6 % an SpaceX. Wenn SpaceX eine Bewertung von 1,77 Billionen Dollar anstrebt, wäre Googles Anteil 88,5 bis 106,2 Milliarden Dollar wert
    Ich bin gegenüber AI/LLMs an sich nicht skeptisch, aber solche Ringgeschäfte wirken sehr verdächtig, und ich frage mich, was passiert, wenn die Musik aufhört zu spielen.

    • Es gibt auch eine andere Möglichkeit. Im Moment gibt es einen Compute-Mangel, und xAI könnte Compute-Ressourcen besitzen und sie gut betreiben
      Es gibt keine ungenutzten GPUs, und in Frontier-AI-Laboren wird Compute direkt zu Geld. Es stimmt zwar, dass es einige fragwürdige Ringgeschäfte gibt, aber ich glaube nicht, dass dieser Fall dazugehört.
    • Wenn solche Deals von spekulativen Akteuren gestützt würden, bestünde das Risiko, dass die Musik aufhört, aber AI hat echten Wert und echte Umsätze
      Das ist kein Spekulationsprodukt, bei dem man Tokens kauft, um sie weiterzuverkaufen; Tokens werden vielmehr im Moment der Inferenz verbraucht.
    • Das klingt so, als wolltest du sagen, dass Googles SpaceX-Anteil mit diesem Deal 88 Milliarden Dollar wert ist und ohne ihn wertlos wäre
      Tatsächlich ist schwer zu sagen, wie stark dieser Deal die Marktkapitalisierung von SpaceX erhöht, und solange Google seinen SpaceX-Anteil nicht bald verkauft, ergibt das als Ringgeschäft ohnehin wenig Sinn.
    • Wird da nicht einfach jemand gerettet und der Zyklus beginnt von vorn? Irgendwie scheint es doch immer so zu laufen.
    • Google hat gerade auch eine neue Kapitalaufnahme über 80 Milliarden Dollar angekündigt
      Ich weiß nicht, ob die Wahl von Eigenkapital statt Schulden teilweise dazu dient, den IPO-Hype um Anthropic und OpenAI abzuschöpfen, aber es wird interessant sein zu sehen, wie der Markt dieses neue Aktienangebot aufnimmt. Irgendjemand wird sein Ziel bei der Kapitalaufnahme verfehlen, und wer später an die Börse geht, könnte die Last tragen müssen.
  • Wurde nicht bis vor Kurzem noch gesagt, die SpaceX-Bewertung beruhe auf einem Teil der Starlink-Gewinne und massiver Spekulation?
    Aber jetzt, wo bekannt wurde, dass von Google und Anthropic 2,2 Milliarden Dollar pro Monat bzw. 26 Milliarden Dollar neuer Jahresumsatz kommen, dreht sich die Diskussion nicht dorthin, sondern in Richtung „xAI-Technologie taugt wenig“ oder „die Google/SpaceX-Struktur schadet der Wirtschaft“.
    Das ist motiviertes Schlussfolgern. Wenn neue Informationen hereinkommen, sollte man bestehende Schlussfolgerungen aktualisieren, stattdessen sucht man nur nach einem anderen Weg, negativ zu reagieren. Leute, die Elon/SpaceX nicht mögen, vergiften die Erzählung vollständig.

    • Der Kernpunkt ist meiner Ansicht nach, dass xAI seine GPUs/Rechenzentren zwar monetarisiert, aber mit einem REIT-/Vermietungs-Multiple statt mit einem Frontier-Lab-Multiple
      xAI scheint entschieden zu haben, dass dies der beste Weg ist, Wert aus den eigenen Assets zu ziehen. Offenbar glauben auch Google und Anthropic, dass sie diese Assets produktiver einsetzen können als SpaceX selbst.
    • Beides kann gleichzeitig wahr sein. Ursprünglich sollte Kapital eingesetzt werden, um einen spekulativen Preis zu rechtfertigen, stattdessen wird Kapital eingesetzt, um eine mäßige Kapitalrendite zu erzielen
      Damit wird die Spekulationslogik einerseits entkräftet, andererseits zeigt es, dass es genau auf der Technologieseite, die Kern dieser Spekulation war, Probleme gibt.
    • Diese Bedenken unterscheiden sich ausreichend voneinander, sodass es ziemlich plausibel ist, dass sie von unterschiedlichen Personen kommen
      Wenn man sowohl Grok als auch Konkurrenzmodelle benutzt, ist der Grundpunkt schwer zu widerlegen, dass Grok nicht so gut ist wie die Konkurrenzmodelle. Ob das geschäftlich relevant ist, muss nicht zwangsläufig so sein.
    • Dem stimme ich nicht stark zu. Was die Erzählung vergiftet, ist die allgemeine Haltung pro oder contra Elon, und das gilt ebenso für Teslas absurde Bewertung
      In diesem Fall verändert das umgestellte Geschäftsmodell aber das Wertversprechen grundlegend. Ich verstehe nicht, warum die Erzählung „Ein Raumfahrtunternehmen, das mit Raumfahrt Geld verdient, spielt jetzt Wiederverkäufer von Compute, und das soll gut sein“ vorzugswürdiger sein sollte.
      Und irgendeine „Erzählung“ nicht direkt zu widerlegen, sondern sie faktisch nur indirekt anzugreifen, überzeugt mich ebenfalls nicht. Es bleibt unklar, wer hier eigentlich „wir“ ist, und es wirkt, als würde ein nicht vorhandener Konsens behauptet.
  • Jetzt wissen wir, zu welchem Preis diese GPUs vermietet werden. Jetzt interessiert mich wirklich der Input-Kostenblock der Stromerzeugung
    Bleibt bei diesen Deals für xAI tatsächlich genug Marge übrig, um die Abschreibungskosten zu decken?
    Laut Fußnote läuft Colossus größtenteils mit eigenen Gasturbinen vor Ort, mit einem Wärmewirkungsgrad im einfachen Zyklus von etwa 10.000 Btu/kWh und bei einem Henry-Hub-Gaspreis von 3,50 $/MMBtu liegen die Brennstoffkosten bei rund 90 Millionen Dollar pro Jahr
    Das ist absurd billig. Wie kann ich selbst in das Geschäft einsteigen, GPUs an Hyperscaler zu vermieten?

    • Der schwierige Teil ist, überhaupt an GPUs zu kommen. Schon die Beschaffung an sich ist schwierig, und sie dann noch zu einem vernünftigen Preis zu bekommen, ist eine weitere Hürde.
  • Das ist kein Rechenzentrums-REIT. Ein Rechenzentrums-REIT verkauft keinen Compute, sondern Fläche, Strom und Kühlung, in die Compute eingebracht wird
    Ich verstehe, worauf der Autor hinauswill. Gemeint ist wohl, dass die wertvollste Ressource von SpaceX Compute-Kapazität ist, aber die Analogie ist nicht ganz treffend
    Derzeit ist SpaceX faktisch eher eine Holding, die fast alles von Elon außer Tesla bündelt. Wer auf SpaceX wettet, wettet auf einen Mischkonzern.

  • Sie haben zwar ein LLM entwickelt, also ist es schon ein AI-Forschungslabor, aber wenn man sich die Modellqualität ansieht, ist es nichts, was man als Spitze des Feldes bezeichnen würde.

    • Ich nutze ChatGPT, Claude, Gemini und Grok alle mit kostenpflichtigen Accounts.
      Jedes hat seine Vor- und Nachteile, und persönlich finde ich ChatGPT immer noch am besten, danach Gemini/Claude und danach Grok.
      Grok wirkt im allgemeinen Einsatz oft 1–2 Generationen hinter den Konkurrenzmodellen, aber es gibt drei Dinge, die ich daran mag. Erstens scheint das Verständnis aktueller Ereignisse am besten zu sein. Ob das an der X-Integration liegt oder an der Optimierung der Backend-Tool-Aufrufe, weiß ich nicht, aber wenn man nach laufenden Ereignissen fragt, sind die Informationen bei anderen Modellen oft veraltet oder die Antworten eher schwach.
      Zweitens ist es bei persönlichen Themen im Allgemeinen am wenigsten schmeichlerisch. Anthropic geht auch in diese Richtung, und ChatGPT sowie Gemini verbessern sich ebenfalls, aber ältere Modelle haben kaum je etwas Negatives über das gesagt, was ich tue. Wenn ich Karriereberatung oder persönliche Ratschläge brauche, gefällt mir der Ton von Groks Antworten.
      Drittens gibt es bei der Arbeit Themen, die andere Modelle nicht anfassen wollen. In meiner früheren Firma hatten wir sehr viele Nutzer aus dem juristischen Bereich, und wenn man bestimmte Themen aus Zeugenaussagen zusammenfassen musste, verweigerten die meisten Modelle das, Grok jedoch nicht. Ich verstehe die Notwendigkeit von Sicherheit und mache anderen Anbietern keinen Vorwurf, aber es gibt auch professionelle Arbeit, bei der man unbedingt ein Modell braucht, das mit sensiblen Themen umgehen kann.
    • Benchmarks scheinen etwas anderes zu sagen, aber wenn ich bestimmte Informationen suche, die sich nicht leicht über Websuche finden lassen, nutze ich ChatGPT, Gemini und Grok alle drei.
      Bei Dingen wie „Finde mir das GitHub-Repository, das 2017 $vague_thing gemacht hat“ liefert Grok häufiger die gesuchte Information.
    • Das Modell könnte auch einfach ein Marketingaufwand gewesen sein, um das Rechenzentrumsmodell zu kapitalisieren.
      Ich meine nicht, dass es absichtlich so gemacht wurde, aber faktisch hat es genau so gewirkt.
    • Wenn man Elon glaubt, plant xAI auch, ein LLM noch einmal von Grund auf neu zu bauen.
      Dafür braucht man kein Rechenzentrum für Inferenz, sondern ein riesiges Trainings-Rechenzentrum.
    • Grok ist nicht ganz vorne an der absoluten Spitze, aber es gehört definitiv noch zu diesem Bereich.
  • Für alle, die damit nicht vertraut sind: REIT steht für real estate investment trust, also einen Immobilieninvestmentfonds.

  • Ist dieser Beitrag eine ausgeschriebene Version des Kommentars von HN-Nutzer runako[1] von vor zwei Tagen?
    Es ist natürlich gut möglich, dass mehrere Leute gleichzeitig auf dieselbe Idee gekommen sind, aber wenn der Autor den Beitrag selbst gepostet hat, wirkt das Fehlen einer Erwähnung etwas unhöflich.
    [1] https://news.ycombinator.com/threads?id=runako#48426082

  • Dieselbe Idee kam auch hier in den Kommentaren vor zwei Tagen auf: https://news.ycombinator.com/item?id=48426082

    • Ergänzend wurde auch gesagt, dass xAI offenbar aus dem AGI-Rennen herausfällt: https://news.ycombinator.com/item?id=48214042
      Inzwischen ist es sehr schwer, OpenAI und Anthropic einzuholen. Der positive Kreislauf aus Umsatz generieren, mit diesem Umsatz mehr Computing kaufen und mit mehr Computing intelligentere Modelle trainieren hat den Wettbewerb deutlich erschwert.
      Wenn man bei modernsten LLMs nicht mehr konkurrieren kann, ergibt es aus Sicht von SpaceXAI mehr Sinn, auf der Seite des Computing-Angebots zu stehen.
  • Elon ist stark bei Hardware, aber bei xAI hat er Entlassungen im Stil der PayPal Mafia in großem Maßstab durchgezogen und kurz darauf, wie schon bei der Twitter-Übernahme, wieder versucht einzustellen, ist aber daran gescheitert, in großem Umfang Softwareingenieure zu gewinnen.
    Die Rechenzentrumsdeals kamen danach. Doch jemand, der der Welt Meinungsfreiheit sichern und ein „menschenfreundliches“ AI-System versprechen wollte, verkauft nun an Konkurrenten und reduziert gleichzeitig die täglichen Nutzungslimits der eigenen Grok-App auf einstellige Multiplikatoren.
    Wenn man mit dem reichsten Mann der Welt Geschäfte macht, kann man trotz aller sonstigen Rhetorik vorhersagen, dass Geld letztlich vor anderen Erwägungen kommt. Trotzdem ist es eine interessante Strategie.
    Fairerweise sollte man sagen, dass sie in einem Interview im letzten Jahr meinten, Hardware sei der „Flaschenhals“. Ich bin aber fest davon überzeugt, dass sie die Softwareprobleme unterschätzt haben. Die App hatte viele Probleme und hat sie noch immer.

    • Ich weiß nicht genau, was mit „Elon ist stark bei Hardware“ eigentlich gemeint ist.
  • xAI ist ein vertikal integriertes Unternehmen und hat die Computing-Seite sehr gut umgesetzt. Das Spitzenmodell schwankt zwischen echter Spitzenklasse und 1–2 Generationen Rückstand, und auf dem Papier war es einmal kurz ganz oben.
    Wenn es morgen wieder an die Spitze kommt, haben sie das Know-how zum Skalieren. Wenn Google oder Anthropic zustimmen, könnten sie die verliehenen Ressourcen sogar zurückkaufen.