7 Punkte von GN⁺ 2025-09-15 | 2 Kommentare | Auf WhatsApp teilen
  • In diesem Jahr geben die vier globalen Big-Tech-Unternehmen 344 Milliarden US-Dollar für KI aus und investieren den Großteil davon in Rechenzentren zum Training und Betrieb von Large Language Models (LLMs)
  • LLMs haben sich bereits durchgesetzt – mehr als 700 Millionen Menschen nutzen ChatGPT jede Woche –, doch das Entwicklungstempo verlangsamt sich und Grenzen wie Halluzinationen, hohe Kosten und nur geringe Leistungsverbesserungen werden sichtbar
  • Das chinesische Unternehmen DeepSeek überraschte den Markt mit einem kleineren und effizienteren Modell, während Firmen wie Covariant (Robotik) und Atman Labs (nicht auf Deep Learning basierender Ansatz) auf die physische Welt reagierende KI erforschen
  • Jüngste Forschung zeigt, dass die soziale Schlussfolgerungsfähigkeit von LLMs von wenigen Merkmalen abhängt und schon bei kleinen Änderungen anfällig ist; auch OpenAI räumte die Möglichkeit eines Versagens von Schutzmechanismen für vulnerable Gruppen ein
  • Experten kritisieren LLMs als bloße „Token-Generatoren“ und warnen, dass die Fixierung auf eine einzige Technologie die Marktinstabilität erhöhen kann, weshalb man sich auf das Aufkommen neuer Ansätze vorbereiten sollte

Riesige KI-Investitionen und der Fokus auf LLMs

  • Jeder Investor weiß, dass man nicht „alle Eier in einen Korb legen“ sollte – warum setzt das Silicon Valley also nur auf einen einzigen Weg, künstliche Intelligenz (KI) zu entwickeln?
  • Die vier größten Technologieunternehmen der Welt investieren 2025 344 Milliarden US-Dollar in KI und konzentrieren sich dabei vor allem auf den Bau von Rechenzentren für das Training und den Betrieb von Large Language Models (LLMs)
  • LLMs verarbeiten multimodale Eingaben wie Text, Audio und visuelle Inhalte und basieren auf der Technik der Vorhersage des nächsten Tokens in einer Sequenz
  • Persönliche Chatbots wachsen schnell, einige KI-Startups erzielen bereits Gewinne und Unternehmen steigern mit generativer KI erste Produktivitätswerte
  • LLMs sind die erste KI-Technologie, die den Mainstream erreicht hat; ChatGPT hat wöchentlich mehr als 700 Millionen Nutzer
  • Einige Startups haben den Break-even erreicht, doch in sensiblen Bereichen wie Medizin und Rechtswesen bleibt die Vertrauenswürdigkeit wegen Halluzinationen begrenzt

Das Risiko der Fixierung auf eine einzige Technologie

  • Sich auf eine einzige Technologie zu konzentrieren, ist jedoch riskant; frühere Fehlschläge zeigen das, etwa BlackBerry, das an physischen Tastaturen festhielt und von Apples Touchscreen verdrängt wurde, oder Yahoo, dessen Wette auf das Portalmodell von Googles Suchdominanz überholt wurde
  • Auch LLMs könnten denselben Weg gehen; falls neue KI-Ansätze auftauchen, droht den massiven Investitionen das Risiko zu stranden
  • Das chinesische Unternehmen DeepSeek bewies im Januar mit einem kleineren, effizienteren LLM und einer offenen Architektur die Möglichkeit unkonventioneller Ansätze und überraschte damit den Markt

Die Suche nach alternativen Ansätzen

  • KI-Fortschritt entsteht durch die Verbindung früherer Einsichten mit neuen Ideen, und auch das Streben nach superintelligenten Maschinen erfordert einen vielfältigen Ansatz
  • Startups wie Covariant entwickeln Software für räumliche Wahrnehmung, statt nur Datenmuster zu analysieren, und entfernen sich damit vom LLM-Zentrum
  • Unternehmen aus Robotik, Drohnen, Wirkstoffforschung und Klimamodellierung benötigen physische Reaktionen in Echtzeit und entfernen sich daher vom LLM-Fokus
  • Das britische Unternehmen Atman Labs gräbt vergessene Ideen aus der Zeit vor dem Deep Learning wieder aus und spiegelt damit den frühen Multi-Track-Ansatz von Google DeepMind wider (z. B. AlphaGo, Reinforcement Learning)

Grenzen von LLMs und Vertrauensprobleme

  • Inzwischen zeigen sich Risse in der Logik der Large Language Models: von extrem hohen Kosten bis hin zur Aussicht auf sinkende Erträge
  • Die neuesten Modelle von OpenAI oder Google sind nur geringfügig besser als ihre Vorgänger – selbst dann, wenn noch mehr Geld hineingesteckt wird
  • Dennoch verschwinden Halluzinationen nicht und bleiben ein Hindernis für den Einsatz in Unternehmen etwa bei medizinischen oder juristischen Analysen
  • Eine aktuelle Nature-Studie zeigt, dass die soziale Schlussfolgerungsfähigkeit von Sprachmodellen von einer sehr kleinen Zahl von Merkmalen abhängt und schon bei kleinen Veränderungen zusammenbrechen kann, was grundlegende Fragen zur Zuverlässigkeit aufwirft
  • OpenAI räumte ein, dass bei langen Gesprächen Schutzmechanismen für vulnerable Gruppen zusammenbrechen könnten; tatsächlich kam es zu einem Vorfall, bei dem einem Jugendlichen Anweisungen zur Selbstverletzung gegeben wurden

Kritik aus der Branche und Ausblick

  • Fei-Fei Li: „In der Natur gibt es keine Sprache, und die Welt folgt physikalischen Gesetzen“ – ein Hinweis auf die Grenzen eines sprachzentrierten Ansatzes
  • Alex Karp (Palantir-CEO): „Das Silicon Valley hat LLMs überhypt“
  • Yann LeCun: LLMs seien eine „Sackgasse“ auf dem Weg zu intelligenteren Maschinen, nicht mehr als „Token-Generatoren“, die weder ihre physische Umgebung verstehen noch vorausplanen können
  • Fazit: LLMs werden bleiben, doch an einer einzigen Lösung festzuhalten, ist riskant; Investoren und Unternehmen sollten sich auf die Möglichkeit eines neuen technologischen Paradigmenwechsels vorbereiten

2 Kommentare

 
mhj5730 2025-09-15

Ab GPT-5 sieht man, dass man versucht, die Leistung mit Mühe über Reasoning hochzuschrauben, aber selbst das scheint nicht einfach zu sein. Antworten, die früher bei einer angemessenen Länge hätten aufhören können, werden jetzt über Dutzende Zeilen hinweg geliefert, und das ist mir ehrlich gesagt zu belastend. seufz

 
GN⁺ 2025-09-15
Hacker-News-Kommentare
  • Auf https://archive.is/2rFK4 ansehen

  • Diese Technologie sieht in Demos unglaublich beeindruckend aus, und man merkt, dass alle wirklich aufgeregt sind; wenn Kollegen oder Führungskräfte sie stolz vorführen oder endlos Witze damit machen, erinnert mich das daran, wie Menschen früher ihre ersten Handys anderen gezeigt haben. Dadurch entsteht die Tendenz, ihren Wert größer wahrzunehmen, als er tatsächlich ist. Es ist wie beim Mobiltelefon eine bedeutende Entwicklung, wird aber kurzfristig wohl nicht den Impact haben, den der Hype verspricht. Besonders in anonymen Foren wird oft darauf hingewiesen, dass das übertrieben ist, während man in beruflichen Rollen gemeinsam die Stimmung mitträgt. Es fühlt sich an, als wüssten alle, was passiert, wollten aber trotzdem, dass die Party weitergeht.

    • Wenn mein Chef AI übermäßig betont und verlangt, dass alle Mitarbeiter All-in gehen, machen in einem schwierigen Arbeitsmarkt viele aus Angst mit. Das gilt umso mehr, weil AI bereits Jobs reduziert. Manche nutzen still und pragmatisch nur die realistischen Tools weiter, die für sie funktionieren, etwa LSPs oder Refactoring. Im professionellen Umfeld können nur wenige mutig sagen: „Der Kaiser ist nackt.“

    • Interessanterweise sieht man in anonymen Foren eher viele Meinungen, dass AI eine lebensverändernde Innovation sei. Zumindest sieht man diese Perspektive leichter, wenn Leute sich nicht als Experten ausgeben. In professionellen Rollen teilt es sich in zwei Gruppen: Menschen, die AI bisher außerhalb ihres eigentlichen Fachgebiets eingesetzt haben, loben sie übertrieben, als hätten sie gerade zum ersten Mal die Smartphone-Revolution gesehen. Wendet man AI aber im eigenen Fachgebiet an, merkt man direkt, dass sie in mancher Hinsicht überbewertet ist, und wird zu einem vorsichtigeren Optimisten. Wer AI im eigenen Spezialgebiet tatsächlich am besten nutzt, ist meist positiv eingestellt, aber eher nüchtern: Sie funktioniert gut in begrenzten Umgebungen.

    • Man vergisst leicht, dass es noch viele niedrig hängende Früchte gibt, bei denen man diese Technologie maximal ausnutzen kann. Die Leute versuchen selbst jetzt noch sehr grundlegende Integrationen. Obwohl es früh ist, kann man mit LLMs schon ziemlich coole Dinge machen. Zum Beispiel kann man mit Cursor eine alte Codebasis modernisieren und neue Features bauen, die man sich schon lange gewünscht hat. Ich habe dafür nur ein paar Stunden gebraucht; auf die alte Weise hätte es ein bis zwei Wochen gedauert. Das zeigt, wie groß das Potenzial ist. Der Hype selbst ist allerdings etwas, das für mich persönlich nicht ganz passt, daher mag meine Wahrnehmung anders sein.

    • In diesem System gibt es keine Fehlerbalken und keine Konfidenzintervalle. Am Ende ist es ein Wortakrobat mit genau einem „Talent“: Ergebnisse zu erzeugen, die auf den ersten Blick plausibel wirken. Natürlich gibt es viele passende Anwendungsbereiche, aber es gibt immer noch viele Lücken, deren Ausmaß man nicht einmal vorhersagen kann und die sich nicht beheben lassen, was der Effizienz Grenzen setzt.

    • Der Vergleich mit dem Smartphone ist interessant. Smartphones haben die Welt definitiv verändert und es gab viel Hype, aber am Ende war die Veränderung real. Ich frage mich, ob du denkst, dass LLMs und AI ebenfalls echte Veränderungen hervorbringen werden.

  • Ich frage mich, wie der Plan zur Amortisation dieser Investitionen aussieht. Selbst wenn alle großen US-Konzerne jährlich 100.000 Dollar an Abogebühren zahlen und alle Haushalte 20 Dollar im Monat, scheint das unter Berücksichtigung der Inferenzkosten und sonstiger Nebenkosten bei Weitem nicht auszureichen, um die Investitionen wieder hereinzuholen. Muss es dafür neue medizinische Durchbrüche geben? Zum Beispiel waren die Nachrichten über OpenAIs gpt-bio und iPSC wirklich beeindruckend. Bis zur Kommerzialisierung ist es allerdings noch ein sehr langer Weg. Ich frage mich, was der tatsächliche Plan ist.

    • Soweit ich mich erinnere, war AGI ursprünglich das Ziel. Es ging nicht darum, mit den heutigen AI-Services ROI zu erzielen. Die Struktur war vielmehr: Wenn AGI kommt, hat man ein Monopol, also haben alle Geld hineingepumpt wie beim Kauf eines Lottoscheins. Im letzten Jahr gab es allerdings keine exponentiellen Fortschritte, daher wirkt der AGI-Traum derzeit etwas gebremst.

    • Der Gameplan zielte von Anfang an auf menschliche Arbeitskraft. Einige Berufe werden bereits vollständig durch AI ersetzt, und beim Rest steigt die Produktivität stark. Der wirtschaftliche Wert davon ist enorm. Auch ohne AGI ersetzt AI-basierte Automatisierung schon jetzt massiv die „billigste und am leichtesten austauschbare“ Arbeit. Aufgaben, die früher an indische Callcenter ausgelagert wurden, wandern zunehmend in Rechenzentren. Die großen AI-Unternehmen glauben, dass sie mit fortgesetzten Investitionen in R&D und Compute am Ende auch AGI erreichen können.

    • Wenn AI dich nicht entlässt, kann AI ihre eigenen Kosten nicht tragen.
      If AI Doesn’t Fire You, It Can’t Pay For Itself

    • Wenn LLMs die Effizienz der gesamten White-Collar-Arbeit tatsächlich verdoppeln könnten, müssten Großunternehmen weit mehr als 100.000 Dollar pro Jahr zahlen. Wenn sie auch nur 25 % der eingesparten Kosten zahlen würden, die durch das Ersetzen der Hälfte der Jobs entstehen, könnten Umsätze erzielt werden, bei denen die heutigen Unternehmensbewertungen sehr günstig wirken würden.

    • 100.000 Dollar pro Jahr sind praktisch nichts. Das sind grob 10 Dollar pro Mitarbeiter; selbst wenn man 100.000 Dollar pro Mitarbeiter inklusive Gehalt und Benefits ansetzt, hätte schon ein Produktivitätszuwachs von 10 % enorme Wirkung. Bei einem Unternehmen mit 10.000 Mitarbeitern wären das 100 Millionen Dollar pro Jahr.

  • Ich habe kein gutes Gefühl dafür, wie groß 344 Milliarden Dollar sind, aber die gesamte Marktkapitalisierung des US-Aktienmarkts beträgt 62,8 Billionen Dollar. Shillers CAPE-Ratio (aktueller Preis / durchschnittlicher Gewinn der letzten zehn Jahre) liegt bei ungefähr dem 38-Fachen. Das bedeutet, dass der durchschnittliche Jahresgewinn über zehn Jahre etwa 1,7 Billionen Dollar beträgt. Entsprechend entsprechen 344 Milliarden ungefähr einem Fünftel des durchschnittlichen Jahresgewinns des US-Aktienmarkts. So lässt sich die Größenordnung vielleicht leichter einschätzen.

    • Ich verwalte mein Portfolio derzeit selbst, passe die erwartete Rendite (BIP + Dividenden) nach Risiko an und leite daraus erwartete Erträge nach Ländern und Regionen ab. Ich justiere ein- bis zweimal im Jahr nach. Wenn man annimmt, dass das hier fast alles eine Blase ist, frage ich mich, wie man die Gewinne des US-Aktienmarkts entsprechend anpassen sollte, insbesondere wenn man es auf AI-zentrierte Tracking-Investments anwenden will.

    • Allerdings sind die 344 Milliarden Dollar kein jährlicher, sondern ein kumulierter Wert.

  • Was wir derzeit haben, ist eine großartige Schnittstelle, die Nutzern reibungslosen Zugang zu sehr komplexen Systemen für Arbeit oder Privatgebrauch verschafft. Aber das ist nicht die eigentliche Substanz; bisher ist es nur eine dünne äußere Hülle. Ich bin nicht sicher, ob diese Revolution am Ende wirklich Billionen von Dollar wert sein wird, aber zum Glück ist das nicht mein Problem, und das beruhigt mich.

  • Dieser „Artikel“ ist Clickbait. Er hat nur eine reißerische Überschrift und kaum Substanz. Im Grunde wirft er nur sinnlose Fragen auf wie: „In manchen Fällen ist das nützlich, aber warum investieren Großunternehmen so viel, wo doch reine R&D vielleicht besser wäre?“

  • So wie Menschen bei den ersten Filmen Angst hatten, von einem Zug überfahren zu werden, stehe ich auch heute auf der Seite derer, die glauben, dass Maschinen denken.

  • Es gibt derzeit definitiv eine Blase am Markt. In letzter Zeit ist die Zahl der Startups, die AI einsetzen, explodiert. Da sie sich innerhalb derselben Produktkategorien differenzieren müssen, werden technische Details in Marketingbotschaften umgewandelt. Aus Sicht des Managements ist es schwer zu unterscheiden, ob zehn Startups, die versprechen „Wenn wir mit unseren Daten trainieren, entsteht der beste Chatbot“, tatsächlich trainieren oder nur ihre Prompts anpassen. So etwas gab es schon früher, das bekannteste Beispiel ist wohl „Deep Research“ und Ähnliches. Solches Marketing hilft zwar beim Wachstum, untergräbt aber das Vertrauen. Tatsächlich hat kürzlich ein Startup eine Series A eingesammelt, das von „erfahrungsbasiertem Lernen“ spricht, obwohl es im Grunde nur Speicher über Prompts legt, um die Leistung zu verbessern (kann man selbst nachschlagen). Das heißt aber nicht, dass keine innovativen Ideen entstehen. Ich persönlich denke, dass Pretraining seinen Zweck bereits weitgehend erfüllt hat. Früher war das Ziel selbst unklar, aber mit dem Aufkommen von RL wurde es vage verständlich. Pretraining und Compute zur Testzeit sind der Kern dafür, allgemeine priors aufzubauen, also Vorwissen, mit dem sich wie beim Menschen verschiedenartige Probleme lösen lassen. Manchmal funktioniert es nicht gut genug, dann ist zusätzliches Training via RLVR nötig. Das ist noch früh, aber ich bin optimistisch, dass in diese Richtung noch einmal eine neue Skalierungskurve entsteht.

  • Unternehmen müssen zwangsläufig in AI investieren, egal ob sie viel oder wenig Geld haben, weil LLMs ihre bestehenden Geschäftsmodelle bedrohen und sie deshalb proaktiv handeln müssen. Wenn sie nicht vorne mit dabei sind, besteht sogar das Risiko, dass die gesamte US-Wirtschaft erschüttert wird. Sollten die großen US-Tech-Konzerne ihre globalen Werbeeinnahmen verlieren (Meta, Google), könnten sie in kürzester Zeit zu leeren Hüllen werden. Denn sobald einzelne Länder oder Wirtschaftsblöcke ihre eigenen Produkte entwickeln und einsetzen, wird es viel zu einfach, US-Produkte zu ersetzen. Die US-Wirtschaft war faktisch zu stark von den Cashflows der FAANG-Unternehmen abhängig, und dieses Geld trieb auch andere Branchen an. Daher kann ich auch verstehen, warum es dieses Dinner mit Trump gab. Wenn diese AI-Dynamik schwächer wird, steht den USA auch wirtschaftlich eine sehr unsichere Zukunft bevor.

  • Der Grund, warum Oracle am Markt so stark bewegt wird, ist die Meldung, dass OpenAI zugesagt hat, Workloads in großem Umfang in die Cloud des Unternehmens zu verlagern. In Wirklichkeit ist das eher eine finanzielle „Engineering“-Strategie, die Umsatz über Gewinn stellt, insbesondere indem CapEx so weit wie möglich in die Zukunft verschoben wird. Kurz gesagt ist das ein Beispiel dafür, wie exzessiv die aktuelle AI-Blase ist. Laut einer aktuellen Analyse des Economist wird der Markt inzwischen nicht mehr durch „Risiko“, sondern durch „Angst vor Verlusten“ oder FOMO angetrieben, und momentan ist FOMO auf dem absoluten Höhepunkt.
    Want better returns? Forget risk, focus on fear (Economist)

    • Dieser jüngste Oracle-Sprung und der Umsatzausblick fühlen sich komplett nach „jumping the shark“ an. Bei einem Unternehmen wie Oracle bin ich mit Wetten grundsätzlich vorsichtig, aber diesmal ist die Versuchung groß, eher eine Short-Position einzugehen.

    • FOMO ist wirklich extrem. Der aktuelle Aktienmarkt bewegt sich wie die Krypto-Blase von früher.