Entscheidungen und Geld: Wie Unternehmen die Frage „Was, wenn Anthropic das baut?“ überleben

(writing.nikunjk.com)

4 Punkte von GN⁺ 3 시간 전 | 2 Kommentare | Auf WhatsApp teilen

Je leistungsfähiger AI-Modelle werden, desto geringer wird der Wert von Software selbst; Anwendungsunternehmen, die überleben wollen, müssen sich gleichzeitig zu Datenunternehmen und Fintech-Unternehmen wandeln
Da Agenten zu den Hauptnutzern von Software werden, bricht das Per-Seat-Preismodell zusammen; wenn tausend Menschen hunderttausend Agenten betreiben, sind das nicht hunderttausend Seats, daher bleiben nur die von Agenten hinterlassenen Entscheidungen (Daten) und das von ihnen bewegte Geld (Fintech) als abrechenbare Einheiten übrig
Frontier-Modelle gleichen einer Gruppe von Genies, die nicht wissen, wie ein Unternehmen arbeitet; das echte Schutzschild ist das implizite Urteilsvermögen (judgment) der Menschen, und die Korrekturhistorie (corrections), mit der Nutzer Modellergebnisse verbessert haben, dient sowohl als Trainingssignal als auch als Testsatz
Wenn kein Geld durch die Daten fließt, bleibt es nicht mehr als ein Wissenschaftsprojekt; nur Fintech mit Netzwerk und Lock-in wie bei Toast, Ramp oder Shopify kann die Marge trotz fallender Modellpreise halten
Die Anhäufung von Urteilskraft, die Kontrolle über Geldflüsse und die Verteidigung von Schreibzugriffen (writes) sind der einzige Weg, auf dem ein Unternehmen selbst dann unersetzlich bleibt, wenn Labs alle Tokens sehen

Modellfortschritt und sinkender Wert von Software

Gestern wurde Claude Fable 5 veröffentlicht, das erste Mythos-Class-Modell, das die breite Öffentlichkeit nutzen kann; in fast allen Benchmarks liegt es auf Platz 1, und je länger die Aufgabe, desto größer der Abstand
- Je intelligenter das Modell, desto stärker sinkt der Wert von Software selbst
Jedes Venture-finanzierte Anwendungsunternehmen muss jetzt ein Datenunternehmen oder ein Fintech-Unternehmen sein, idealerweise beides

Der Wandel der Frage, wer Software nutzt

In einem Text vor 2 Jahren wurde darauf hingewiesen, dass das Per-Seat-Preismodell zerbricht, wenn Agenten zu Nutzern werden, und es scheint, als hätten wir diese Schwelle nun überschritten
- Cloudflare hat angekündigt, dass Agenten-Traffic erstmals menschlichen Traffic überholt hat
- Online gibt es darüber Streit, aber der Trend, dass Agenten zu den Hauptkunden fast aller Software werden, ist eindeutig
Wenn tausend Mitarbeitende hunderttausend Agenten betreiben, sind das keine hunderttausend Seats
Die zwei Dinge, die Agenten hinterlassen und für die man abrechnen kann, sind die Entscheidungen, die sie treffen (= Daten), und das Geld, das sie bewegen (= Fintech)

Entscheidungen (Decisions) — Daten als Schutzgraben

xAI besitzt eine Option, Cursor für 60 Milliarden Dollar zu übernehmen; Cursor liegt bei rund 4 Milliarden Dollar Annual Recurring Revenue
- Das ist nicht der Hauptgrund, warum die Software so teuer ist
- Anthropic und OpenAI beobachten Entwicklerarbeit bereits in Echtzeit über Claude Code und Codex
- xAI kaufte Cursor, um möglichst schnell in den Token-Flow zu gelangen
- Musk, der erste Beinahe-Billionär der Welt, sagte, dass die Aufzeichnungen darüber, wie eine Million Entwickler Modelle tatsächlich nutzen, direkt in das Training von Grok eingehen; der hohe Preis ist eine Maut, um Jahre langsamer Datensammlung zu überspringen
Schon wenige Wochen nach dem Start von Cursor tauchten funktionierende Klone auf, doch keiner konnte sich durchsetzen, weil Cursor über Taste gewann
- Über tausende kleine Entscheidungen dazu, was gezeigt wird und wann etwas wieder verschwindet
- Klone kopieren nur die Oberfläche; die jahrelange Historie dessen, was Entwickler akzeptiert, abgelehnt oder umgeschrieben haben, können sie nicht erben
- Cursor trainiert inzwischen eigene Modelle auf diesen Diffs, Daten werden damit zum primären Schutzgraben
Der Grund für die Bewertung von 60 Milliarden Dollar: Es ist, als würde man 90 % der Belegschaft durch ein Team von Genies ersetzen, das überhaupt nicht weiß, wie das Unternehmen arbeitet
- Fable 5 löst 80 % echter Softwareaufgaben, bei denen das beste Modell des Vorjahres kaum die Hälfte schaffte; Genies lassen sich schwer voneinander unterscheiden und sind austauschbar
- Es gibt einen Grund, warum sie scheitern: Niemand weiß mehr, was die ersetzten Menschen wussten

Implizites Wissen (tacit knowledge) und die Anhäufung von Urteilskraft

Die Zwischenlösung besteht darin, Wissen aus Köpfen herauszuholen und dem Modell als Kontext zu geben, doch das meiste existiert nicht in strukturierter Form
- Der Deal, den man aufgegeben hat, die eine Codezeile, die um 2 Uhr morgens zurückgerollt wurde, der Kunde, dem niemand nachging und bei dem niemand den Grund notierte — genau das ist der eigentliche Kern
- Es ist Urteilskraft, die sich nicht in Workflows niederschreiben lässt und derzeit nicht gespeichert wird
Jetzt verlagert sich alles von Context → Harness → Judgment
- Context ist Retrieval, also das richtige Stück vor das Modell zu bringen
- Harness ist die Schleife bzw. das Scaffolding, in dem das Modell laufen kann
- Judgment ist die letzte Schicht und die einzige, die sich mit Zinseszinseffekt aufbaut: alles, was jeder Aufruf, jede Korrektur und jedes Rollback in den Daten hinterlässt
In praktisch jedem aktuellen Pitch für AI-Anwendungen wird ein Context-Slide als Schutzgraben präsentiert, doch das ist inzwischen nur noch table stakes
- Denn alle Wettbewerber setzen Kontext auf dieselbe Weise zusammen

Die zwei Rollen von Korrekturen (corrections)

Korrekturen kann man als Scorecard sehen: Jedes Mal, wenn ein Nutzer ein Modellergebnis verbessert, wird festgehalten, was in diesem Geschäft richtig ist
Diese Scorecard erfüllt gleichzeitig zwei Aufgaben
- Sie ist ein Trainingssignal, um geliehene Modelle auf dieses Geschäft abzustimmen
- Sie ist ein Testsatz, also das einzige Mittel, um zu wissen, ob Agenten tatsächlich besser werden; öffentliche Benchmarks können einen spezifischen Workflow nicht messen
Es ist nicht nötig, ein Modell von Grund auf vorzutrainieren, selbst Cursor tut das nicht
- Das eigene Modell von Cursor basiert auf einer Open-Source-Basis, und die Diffs sorgen für die Differenzierung
- Fine-Tuning und RL auf Frontier-Modellen sind inzwischen günstig genug, dass auch ein Series-B-Unternehmen diesen Loop fahren kann; vor 2 Jahren brauchte man dafür noch ein Lab
Sarah Guo nennt diesen Bereich the untrainable — Aufgaben, bei denen Außenstehende die richtige Antwort nicht bewerten können — und Korrekturen sind der Weg, dieses Gebiet zu besitzen

Beispiele vertikaler AI-Marktführer

Harvey liegt bei 11 Milliarden Dollar, Legora hat 5 Milliarden Dollar überschritten, beide für den Rechtsmarkt
- Sie wollen nicht nur einzelne Tools liefern, sondern den gesamten Matter besitzen, weil die Korrekturen, die Anwälte an Entwürfen vornehmen, für niemanden sonst sichtbar sind
Rogo verfolgt im Finanzbereich dieselbe Strategie und erfasst, wie Analysten Modelle bauen und Memos korrigieren
Keines dieser Unternehmen trainiert Foundation-Modelle; sie bauen ein Harness um geliehene Modelle und besitzen die darin fließende Judgment-Schicht, und genau diese baut sich mit Zinseszinseffekt auf
Dasselbe gilt für etablierte Anbieter
- Figma besitzt mehr als SVGs: die Geschichte, wie ein Design von v1 zu v47 wurde, und jede verworfene Version dazwischen — ein bewerteter Datensatz über Design-Taste
- Linear besitzt die Debatten unter jedem geschlossenen Ticket
- Notion besitzt die Form des Teamdenkens über tausend Bearbeitungen hinweg
- Selbst wenn ein Konkurrent Kunden abwerben will, all das lässt sich nicht exportieren; es sind Antworten, die in keinem generischen Modell stecken

Wie Labs Urteilskraft einkaufen

Labs kaufen Urteilskraft inzwischen als fertige Ware ein, beginnend mit von Menschen gelabelten Daten
- Mercor ist 10 Milliarden Dollar wert und zahlt seinem Expertennetzwerk 85 Dollar pro Stunde
- Meta zahlte 14 Milliarden Dollar an Scale, um die Pipeline zu besitzen
- Ein Startup in New York putzt Wohnungen kostenlos, wenn es den gesamten Vorgang filmen darf, weil Robotik-Teams sehen müssen, wie Menschen den nächsten Schritt entscheiden
- Mehrere RL-Environment-Unternehmen verkaufen Urteilskraft für Langzeitaufgaben und haben Annual Recurring Revenue in dreistelliger Millionenhöhe erreicht
Die Labs haben das gesamte Internet als Trainingsmaterial weitgehend ausgeschöpft und kaufen Entscheidungen jetzt direkt ein

Geld (Dollars) — Fintech als Schutzgraben

23andMe besaß die DNA von 15 Millionen Menschen und ging trotzdem letztes Jahr bankrott
- Wenn kein Geld durch die Daten fließt, wartet man im Grunde nur auf die Finanzierung eines Wissenschaftsprojekts
- Die meisten Gründer übersehen diese zweite Hälfte
Toast hat das vor Jahren erkannt: Restaurants sind im Kern Zahlungsabwickler mit angeschlossener Küche
- Zahlung erzeugt weit mehr Umsatz als Software
Ramp geht noch weiter: kostenlose Firmenkarte, nirgends Gebühren für den Kunden, aber von jedem Dollar, der durchläuft, bleiben 1 bis 2 Cent hängen, wenn Milliarden fließen
- Ein 32-Milliarden-Dollar-Unternehmen, aufgebaut auf Rundungsfehlern; die kostenlose Karte ist die Vordertür zum Interchange
- Swipe Fees bleiben bestehen, weil das Netzwerk sie stützt, und während das Geld liegt, erzeugt auch der Float Ertrag
Nicht jeder Geldzähler ist ein Schutzgraben
- Eine populäre Vibe-Coding-App erzielt auf verkaufte Credits etwa 50 % Marge; der Großteil ihres Annual Recurring Revenue ist ein Aufschlag auf Inference
- Hinter Token-Aufschlägen steckt kein Netzwerk, und die eigenen Inference-Kosten sinken jedes Quartal; wenn Modelle billiger werden, schmilzt die Marge weg
- Nachhaltiges Fintech ist mit Lock-in unterlegt: Zahlungen, die ein Netzwerk verteidigt, oder Kredite, die auf Daten basieren, die Banken nicht sehen können

Zahlungsinfrastruktur für Agenten

Zahlungsinfrastruktur für Agenten läuft endlich an
- Wenn Agenten Flüge buchen, Teile bestellen und Vendors bezahlen, muss etwas die Belastung autorisieren, transportieren und Gebühren einbehalten
- Stripe hat dafür ein Protokoll veröffentlicht, Visa und Mastercard konkurrieren darum, den Standard zu setzen
- OpenAI behält bereits ein paar Prozent von allem ein, was seine Agenten kaufen
- Die Transaktionen von 1 Billion Agenten könnten bald zur größten Zahlungsökonomie der Geschichte werden

Das eine in das andere verwandeln

Die besten langlebigen Anwendungsunternehmen behandeln diese beiden Hälften nicht getrennt
- Judgment ist die Aufzeichnung von Entscheidungen über Arbeit, Fintech die Aufzeichnung von Entscheidungen über Geld, und starke Unternehmen verwandeln das eine in das andere
Shopify ist das beste Beispiel
- Begann mit Store-Software → fügte Payments an → bietet mit Shopify Capital Kredite an, abgesichert durch Umsatzdaten aus den Stores, also Kredite, die eine Bank allein nicht vergeben könnte
- Wächst der Händler, steigen die Umsätze, und die Daten helfen beim nächsten Kredit
- Heute stammen rund drei Viertel der Shopify-Umsätze nicht aus Software-Abos, sondern von der Geldseite
- Stripe fährt denselben Loop mit Radar, Ramp mit Ausgabendaten und Karten
Rippling versucht etwas Ähnliches; das Kernobjekt ist der Mitarbeiter
- Payroll, Benefits, Geräte und Karten hängen alle von einer gemeinsamen Source of Truth ab
- Noch hat niemand diesen Bereich vollständig gelockt, und Gusto wie auch Deel wachsen parallel, aber das Unternehmen, das das Objekt besitzt, baut mit Zinseszinseffekt auf, während der Rest per Hand zusammensetzt

Schreibzugriffe verteidigen (Guard the writes)

Es gibt eine ungelöste „headless“-Spannung
- Wenn jede Software von Agenten genutzt wird, muss man Agenten zulassen, um nützlich zu bleiben, kann aber nicht alles von ihnen vereinnahmen lassen, wenn man überleben will
- Jedes System of Record muss offen genug sein, damit Agenten über irgendein Protokoll andocken können, und zugleich geschlossen genug, damit niemand abwandert, nachdem er bekommen hat, was er brauchte
- Salesforce hat dieses Jahr erstmals öffentlich Slack-Daten vor Glean und externen Agenten abgeschirmt
Der Weg zu einem nachhaltigen Unternehmen ist Trennung
- Agenten lesen lassen, denn Lesen ist billig und ohnehin wichtig
- Schreibzugriffe verteidigen
Der Punkt, an dem neue Urteilskraft eingegeben wird und Menschen wie Agenten sich gegenseitig freigeben, korrigieren und zurückrollen, ist der Teil, den Wettbewerber nicht einfach verlagern können
- Was sie abschöpfen, ist der Stand von gestern; nur die Entscheidungen, die jetzt getroffen werden, bleiben wirklich dein Eigentum

„Was, wenn Anthropic das baut?“

Man kann einwenden, dass die Labs bereits im Token-Flow sitzen und es daher keinen Schutzgraben mehr gibt
- Claude Code sieht jeden Befehl, den Entwickler ausführen, und jeden Vorschlag, den sie ignorieren; ChatGPT beobachtet an einem Tag mehr Entscheidungen, als ein Produkt in einem Jahr aufzeichnet
Die Antwort darauf: Was ihre Tools sehen, ist größtenteils generisch
- Dasselbe Coding und Schreiben, das alle Modelle sehen, also genau das, was die Labs gegenseitig zur Commodity machen wollen
- Die seltene Urteilskraft liegt tief in einzelnen Unternehmen — wie ein Krankenhaus Scans liest, bei welchen Deals eine Firma gelernt hat wegzugehen — und nichts davon erreicht die Chatbox eines Labs
Die Labs sagen Unternehmen seit Jahren, dass sie nicht auf deren Daten trainieren
- Implizites Wissen, das durch Modelle in einem Produkt läuft, bleibt vertraglich Eigentum des Unternehmens; die Labs sehen die Trace vorbeiziehen, verpflichten sich aber, sie nicht zu speichern
Die Fintech-Hälfte ist zudem etwas, das Labs gar nicht wollen
- Daten nehmen Labs gern mit, aber ein Kreditbuch, Betrugsverluste oder Money-Transmitter-Lizenzen in 40 US-Bundesstaaten sind für sie wertlos
- Für Käufer machen Daten eine Übernahme attraktiv, Fintech macht das Unternehmen schwer herauszulösen
Cursor baute die beste Datenmaschine seiner Kategorie, und ein Lab kaufte sie für 60 Milliarden Dollar
- Ob das ein Traum oder eine Warnung ist, merkt man erst, wenn es zu spät ist, den Kurs zu ändern
- Baue die zwei Dinge, die überleben: Urteilskraft anhäufen und an den Knotenpunkten des Geldes sitzen — so übersteht man die Frage „Was, wenn Anthropic das baut?“

2 Kommentare

heim2 13 분 전

Klingt irgendwie plausibel, ist aber schwer zu verstehen.

somang04 2 시간 전

Die Anhäufung von Urteilsvermögen, die Kontrolle über den Geldfluss und die Verteidigung von Schreibvorgängen (writes) seien der einzige Weg, wie ein Unternehmen unersetzlich bleiben kann, selbst wenn das Lab alle Tokens sieht -> Die Bedeutung davon ist etwas unklar; könnten Sie das vielleicht näher erläutern?