Wer wird den Preis der Intelligenz festlegen?
(x.com/JayaGup10)- Während AI Intelligenz zu einer bepreisbaren Ressource macht, konkurrieren alle Ebenen des Marktes darum, wer diesen Preis kontrollieren wird
- AI-Labs wollen, dass die Nutzung durch sie hindurchfließt, Applikationen versuchen zu beweisen, dass sie Intelligenz besser zuteilen können als Labs, und Staaten wollen, dass Intelligenz so günstig wird, dass sie zur nationalen Infrastruktur werden kann
- Die Kosten von Intelligenz sind nicht länger nur ein Input von Software, sondern wirken als Achse (axis), entlang der Unternehmen, Märkte und Geopolitik neu geordnet werden
- Der Grund, warum AI-Investments anders sind als Software-Investments, liegt darin, dass es mehr Variablen gibt, diese Variablen ungleichmäßig gekoppelt (coupled) sind und jede Variable sich in Untervariablen zerlegt, die sich auf eigenen Kurven bewegen
- Man analysiert ein System, in dem die Gleichung selbst stündlich neu geschrieben wird, und wenn sich irgendeine Variable stark genug bewegt, verändert sie die Bedeutung der anderen — eine fortlaufende Neuordnung
Warum AI-Investments anders sind als Software-Investments
- In Software funktionierte Pattern Matching zwar nur begrenzt, aber es funktionierte: Distributionskosten (distribution cost) bestimmten die Effizienz der Kundengewinnung, Wechselkosten (switching cost) entschieden über Bindung und Ausbau
- CAC payback, NDR, magic number und Rule of 40 sind alles nachgelagerte Resultate dieser beiden Kräfte
- AI bricht das aus drei Gründen auf
- Es gibt mehr Variablen im System
- Die Variablen sind ungleichmäßig gekoppelt
- Jede Variable zerfällt in Untervariablen, die sich entlang eigener Kurven bewegen
- Wenn sich nur eine von Capability, Cost, Latency, Deployment, Regulation oder Talent verändert, ändert sich die Bedeutung der übrigen, und wenn eine Beschränkung gelöst wird, verschiebt sich die nächste relevante Beschränkung
Was jede Variable verändert
- Bereits viel diskutierte, vertraute Variablen sind Capability, Cost und Latency
- Schwieriger sind Unlocks aus Forschung und Produktentwicklung, weil sich ihre Art und Tiefe vorab nur schwer modellieren lassen und ihr Eintreten sich immer weiter beschleunigt
- Beschränkungen, die Software als feste Größen behandelte, werden bei AI zu strategischen Entscheidungen: Geopolitics, Deployment, Talent
-
Capability
- Zerfällt in Reasoning, Context, Multimodality, Tool Use, Planning, Memory und Controllability, die sich jeweils auf eigenen Kurven heftig bewegen
- Context hat sich in nur 3 Jahren von 4.000 Tokens auf über 1 Million Tokens ausgeweitet
- Reasoning hat sich von Prompting-Tricks zu einer eigenständigen Modellklasse entwickelt
- Hat Infrastruktur wie Retrieval Pipelines, Output Parser und Prompt Scaffolds absorbiert; diese waren Prothesen (prosthetics), die Schwächen der Modelle ausgleichen sollten
- Ein Modell, das Prompts aufnehmen kann, und ein Modell, das eine Codebase oder Kundenhistorie aufnehmen kann, sind unterschiedliche Produkte; Leistungssteigerungen heben nicht alle Applikationen gleichermaßen an, sondern verschieben den Bottleneck
- Zerfällt in Reasoning, Context, Multimodality, Tool Use, Planning, Memory und Controllability, die sich jeweils auf eigenen Kurven heftig bewegen
-
Cost
- Sinkende Kosten verbessern nicht einfach nur die Marge, sondern verändern, wer überhaupt konkurrieren kann
- Workflows, die einst eine Frontier-API brauchten, wandern zu günstigen Open-Weight-Modellen, feinabgestimmten Spezialmodellen oder gerouteten Stacks, wodurch Premium-Produkte zu Commodity-Features werden
- DeepSeek zeigt besonders deutlich, wie eine veränderte Kostenerwartung auf der Modellebene den Margenpool darüber neu umlenken kann
- Sinkende Kosten verbessern nicht einfach nur die Marge, sondern verändern, wer überhaupt konkurrieren kann
-
Latency
- Wird zu einer Variable, weil AI sich von asynchronem Prompting zu Echtzeit-Workflows bewegt
- Ein langsames Modell mag für das Schreiben von Memos ausreichen, bricht aber bei Sales Calls, Support-Gesprächen, Tutoring-Sessions oder Security-Responses zusammen
- In dem Moment, in dem auf der anderen Seite ein Mensch wartet, bestimmt Latency nicht mehr nur ein Leistungsdetail, sondern ob ein Markt überhaupt existieren kann
- Voice überschreitet diese Schwelle, wenn Qualität, Unterbrechungsverarbeitung und Preise im Cent-pro-Minute-Bereich zusammenkommen
- Sinkende Latency macht nicht nur dasselbe Produkt schneller, sondern öffnet neue Nutzungsoberflächen (surfaces)
- Wird zu einer Variable, weil AI sich von asynchronem Prompting zu Echtzeit-Workflows bewegt
-
Neue Kurven
- Dinge wie Inference-Time Compute, Task Horizon und der Einsatz von AI für die eigene Produktion standen vor 2 Jahren noch nicht einmal auf der Liste
-
Inference-Time Compute
- Der Regler, mit dem man durch 10-fach mehr Compute bessere Antworten bekommt, ist ein echter neuer Faktor, den es in früherer Software nicht gab, und macht die Kosten pro Ergebnis zu einer Frage der Wahl
- Eine 10-Sekunden-Query und eine 10-Minuten-Query auf demselben Modell sind unterschiedliche Produkte mit unterschiedlichem Preis, und die Marge hängt nicht vom Modellpreis, sondern vom Urteil des Systems ab
- Das ist der Gegenschlag der Applikationsschicht gegen die Labs: Je stärker Frontier-Modelle Produktlogik absorbieren, desto mehr muss jedes Unternehmen behaupten, dass es die Tokens des Kunden besser zuteilen kann
- Das Lab ist auf mehr Nutzung incentiviert, die Applikation dagegen darauf, nur dort auszugeben, wo es Ergebniswert gibt
- Der Regler, mit dem man durch 10-fach mehr Compute bessere Antworten bekommt, ist ein echter neuer Faktor, den es in früherer Software nicht gab, und macht die Kosten pro Ergebnis zu einer Frage der Wahl
-
Task Horizon
- Wenn Inference-Time Compute der Regler für Tiefe ist, dann ist Task Horizon der Regler für Länge: wie lange AI selbstständig arbeiten kann, bevor ein Mensch eingreifen muss
- Die Einheit verschiebt sich von Call zu Workflow
- Agenten laufen über Stunden, erzeugen Sub-Agenten und verbrauchen Millionen Tokens pro Entscheidungspfad, sodass die Nutzung nicht länger proportional zu Seats ist
- Multipliziert man Länge und Tiefe, erhält man die Token-Rechnung, nach der jeder CFO eines Fortune-500-Unternehmens fragt
- Wenn Inference-Time Compute der Regler für Tiefe ist, dann ist Task Horizon der Regler für Länge: wie lange AI selbstständig arbeiten kann, bevor ein Mensch eingreifen muss
-
Einsatz von AI für die eigene Produktion
- AI wird für die Erzeugung synthetischer Daten, das Schreiben von Code, das Erstellen von Evals und die Verkürzung von Experimentzyklen eingesetzt
- Jede Generation verkürzt die Zeit zum Bau der nächsten, wodurch die Änderungsrate endogen (endogenous) wird
- Durch diese Rekursion ist der Wandelzyklus kürzer geworden als der Fundraising-Zyklus, und die Halbwertszeit mancher Thesis schrumpft weiter
- AI wird für die Erzeugung synthetischer Daten, das Schreiben von Code, das Erstellen von Evals und die Verkürzung von Experimentzyklen eingesetzt
-
Geopolitics
- Hier tritt der Konflikt offen zutage, und China wird strukturell in Richtung Effizienz und Open-Weight-Veröffentlichung gedrängt
- Eingeschränkter Zugang zu Chips und Ausschluss aus Teilen des Frontier-Stacks machen diese Strategie rational
- Die U.S. können bei Open-Weight-Frontier-Modellen weiterhin konkurrieren, haben aber noch keine gleichwertige strukturelle Antwort formuliert
- Software brauchte keine Trainingsläufe im Milliarden-Dollar-Bereich, Frontier Open Weights dagegen brauchen Compute-Finanzierung, Patient Capital, Release Governance, Serving-Infrastruktur und Instrumente zur Konkurrenz um Talente
- Irgendeine US-Gruppe wird diese Trainingskosten über Föderation oder Financial Engineering rationalisieren müssen
- Frontier-Labs glauben, dass die Technologie gefährlich ist, und plädieren daher für fähigkeitsbasierte Regulierung (capability-based regulation); sie profitieren davon, wenn Frontier-Zugang kontrolliert, auditiert, vermessen und hinter APIs gehalten wird
- DeepSeek ist nicht nur eine Modellveröffentlichung, sondern ein Schuss in einem Krieg darum, wer den Preis der Intelligenz festlegt
- Hier tritt der Konflikt offen zutage, und China wird strukturell in Richtung Effizienz und Open-Weight-Veröffentlichung gedrängt
-
Deployment
- Es bleibt offen, weil der Wert nicht vollständig in die Cloud zurückfällt
- Inferenz wandert dorthin, wo sie am günstigsten ist, solange das Produkt nicht beschädigt wird: Frontier Reasoning in die Cloud, Latency an den Edge, Privatsphäre und Personalisierung on-device, Workflows mit Bedarf an allen drei als Hybrid
- Da Modelle nicht nur Daten speichern, sondern den Context, das Gedächtnis, Dokumente, die Stimme, den Code, das Verhalten und die Enterprise-Berechtigungen von Nutzern inferieren, ist Privatsphäre noch wichtiger als bei SaaS
- Wo Inferenz stattfindet, entscheidet darüber, wer die Marge abschöpft, wer den Context besitzt und wem der Kunde vertraut
- Es bleibt offen, weil der Wert nicht vollständig in die Cloud zurückfällt
-
Talent
- In SaaS war Talent eine Ausführungsvariable: Das bessere Team baute schneller, verkaufte besser und arbeitete disziplinierter
- In AI ist Talent ein Rohinput der Produktion (raw input), denn eine kleine Zahl von Forschern kann Architektur, Datenmischung, Eval-Regime und die Cost-Capability-Kurve selbst verändern
- Teams führen also nicht nur passend zum Markt aus, sondern können die Form des Marktes verändern
- Nicht nur operative Qualität, sondern auch Research Taste wird Teil des Assets
Die Bedrohung ist nicht länger der Wettbewerber
- In SaaS stirbt man normalerweise durch ein anderes Unternehmen: einen besser finanzierten Wettbewerber, ein schnelleres Team oder einen etablierten Anbieter, der in das Segment expandiert
- Eine Ausnahme war, wenn ein Unternehmen auf einer fremden Plattform aufbaute und durch Preis- oder Bedingungenänderungen verschwand, ohne je einen direkten Wettbewerber zu haben
- AI macht diese Ausnahme zum Default
- Die Bedrohung in AI ist Layer Migration: Wenn sich Capability, Cost, Latency, Deployment, Regulation oder Trust stark genug verändern, wandert die Aufgabe
- Sie kann zum Modell wechseln, zu einer Open-Weight-Alternative, zur Datenplattform des Kunden, zu einer Agent Runtime oder direkt auf das Device
- Eine weitere Variable ist Demand: Käufer bewegen sich langsam, aber nicht naiv; sie kennen die Lock-in-Kosten, und die Arbitrage in dieser Verzögerung schließt sich
Auch die Art, Unternehmen zu bauen, wird umgekehrt
- Frühere Annahmen und traditionelle VC-Ratschläge verschwinden
- Wenn SaaS Produktivität und gute Stimmung verkauft hat, dann verkauft AI zunehmend Outcomes und Services — ein weniger verzeihendes Geschäft, bei dem das Ergebnis funktionieren muss, damit das Produkt gut ist, und dieses Ergebnis effizient genug produziert werden muss, damit das Unternehmen funktioniert
-
Consumer und Enterprise driften auseinander
- Im Consumer-Bereich reicht Breite: schnell, günstig und breit nützlich, und Fehler werden verziehen
- Im Enterprise-Bereich gelten andere Maßstäbe: Es muss innerhalb eines konkreten Workflows funktionieren und dabei den Context, die Berechtigungen, die Daten und die Risikotoleranz des Kunden eingebettet haben
- Deshalb ist ein Frontier-Modell allein kein Enterprise-Produkt; der Wert liegt in der Schicht aus Applikation, Orchestrierung, Services und proprietären Daten, die das Modell im Unternehmen nützlich macht
-
Distribution und Talent
- Das Modell von gestern kann ein neues Produkt ermöglichen, sodass ein Unternehmen seine Position schon am Dienstag verändern kann
- Manche Unternehmen haben das Profil ihrer Vertriebsteams bereits in Richtung Menschen verändert, die ein bewegliches Ziel verkaufen können
- Ein Top-down-Ansatz funktioniert bei manchen Unternehmen von Anfang an
- Das Modell von gestern kann ein neues Produkt ermöglichen, sodass ein Unternehmen seine Position schon am Dienstag verändern kann
-
Wirtschaftsstruktur
- Services-as-Software verändert die Preisgestaltung, und Partnerschaften mit Systemintegratoren entstehen Jahre früher als im klassischen Playbook
- Der Markt spaltet sich: Einige Investoren sehen Portfolios, in denen das Produkt laufend neu gebaut wird, und schließen daraus, dass das Produkt kaum wichtig ist und Services das eigentliche Geschäft sind; andere reagieren allergisch auf alles, was nach Beratung aussieht
- Die unbequemere Wahrheit ist, dass sich in AI Product, Services, Deployment und Distribution je nach Unternehmen neu zusammensetzen
-
Innovation der Gründer
- Enger ICP, ein einzelner Wedge, langsamer Aufbau, vorhersehbare Einstellungen, product-led Bindung: Nichts davon reicht in einem Markt, in dem die Variablen nicht stillstehen und Kunden keine Point Solution wollen
- Zu den scheinbar erfolgreichen Faktoren gehören schnelle Feedback-Loops, kleine Teams mit Entscheidungsmacht und das Wohlbefinden damit, sich dem Wandel entsprechend neu zu organisieren statt nach einem 6 Monate alten Plan
Die Aufgabe für Gründer und Staaten
- In AI wird Wert nicht einmalig eingefangen und verteidigt, sondern fortlaufend neu bepreist und neu verteilt; Variablen sind das Instrument, um Richtung und Tempo dieser Umverteilung zu lesen
- Jedes AI-Unternehmen sitzt auf einem Stapel von Annahmen, und robuste Unternehmen wissen, bei welchen Annahmen sie long und bei welchen sie short sind
- In AI zu investieren und zu bauen ähnelt eher dem Führen eines Trading Books als der Due Diligence eines Softwareunternehmens
- Man ist auf manche Kurven long, auf andere short und exponiert gegenüber Korrelationen, die genau im wichtigsten Moment brechen können
- Man muss wählen, auf welche Variablen man setzt, wissen, welche Variablen einen töten können, und das Unternehmen so bauen, dass es sich schneller von falschen Wetten erholen kann, bevor diese sich durch Zinseszinseffekte aufstapeln
-
Die politische Ebene
- Die U.S.-Regierung wäre besser aufgestellt, wenn sie zwei Variablen zugleich bearbeiten könnte: gefährliche Frontier kontrollieren, ohne Intelligenz so teuer zu machen, dass nur geschlossene Labs und konkurrierende Staaten die Zukunft definieren können
- Gewinnen wird nicht das Land, das am meisten reguliert oder am meisten offenlegt, sondern das einen Weg findet, Intelligenz sicher genug zu machen, um ihr zu vertrauen, und zugleich günstig genug, damit sie sich verbreiten kann
Noch keine Kommentare.