OpenAI aktiviert „Code Red“, um ChatGPT gegenüber Googles Vorstoß zu verbessern

(theverge.com)

2 Punkte von GN⁺ 2025-12-03 | 3 Kommentare | Auf WhatsApp teilen

OpenAI hat einen Notfallmodus mit der Stufe „Code Red“ aktiviert, um die Qualität von ChatGPT zu verbessern und die durch Googles Vorstöße ins Wanken geratene Führungsposition zurückzugewinnen.
Die schnelle Ergänzung von Kernfunktionen wie Personalisierung, Geschwindigkeit, Zuverlässigkeit und Erweiterung des Fragenumfangs ist derzeit besonders dringlich; deshalb werden alle neuen Projekte wie Werbung, Pulse, Health- und Shopping-Agenten auf Eis gelegt oder verzögert.
Das Ergebnis, dass Googles Gemini 3 in zahlreichen aktuellen Benchmarks mehrere OpenAI-Modelle überholt, sowie der starke Nutzeranstieg des Bildmodells Nano Banana bei Google KI von 450 Millionen auf 650 Millionen MAU gilt als Hauptbedrohung.
OpenAI steht außerdem unter wachsendem finanziellen Druck durch Datacenter-Investitionsvereinbarungen in Billionenhöhe, die Notwendigkeit von 200 Milliarden US-Dollar Jahresumsatz bis 2030, und die Expansion von Anthropic im Enterprise-Bereich als zusätzlichem Wettbewerbsfaktor.
OpenAI hat ein tägliches Prüfregime eingeführt und Teamneuaufstellungen vorgenommen; intern wurde zudem betont, dass das bald veröffentlichte neue Reasoning-Modell dem neuesten Gemini-Modell überlegen sei – ein Zeichen dafür, wie entscheidend die Rückeroberung der Führungsrolle geworden ist.

Aktivierung von „Code Red“ und Plan zur Verbesserung von ChatGPT

OpenAI hat intern bestätigt, den höchsten Notfallmodus „Code Red“ aktiviert zu haben, um Probleme in ChatGPT zu beheben.
- OpenAI nutzt ein drei-stufiges Alarmsystem: gelb → orange → rot. Diese Maßnahme liegt eine Stufe über dem vorherigen Code Orange.
Der Verbesserungsumfang umfasst die gesamte Nutzererfahrung, einschließlich stärkerer Personalisierung, höherer Antwortgeschwindigkeit, verbesserter Serverzuverlässigkeit und eines größeren Spektrums beantwortbarer Fragen.
Deshalb wurden alle neuen Projekte wie Werbung, Pulse (digitaler Assistent), Health- und Shopping-Agenten nachrangig behandelt.
- Das Unternehmen forderte eine unternehmensweite Neuverteilung von Personal und führt einen dedizierten täglichen Call ein, in dem der Entwicklungsstand laufend geprüft wird.
Es gab kürzlich Beschwerden über GPT-5 wegen eines kühlen Tons und Fehlern bei Standardfragen, wodurch auch die Neujustierung von Sprachstil und Instruktionsausführung Teil der Maßnahmen wurde.

Googles Aufholjagd mit Gemini und der Wettbewerbsdruck

Das neue Modell Gemini 3 von Google liegt in vielen Branchenbenchmarks vor OpenAI, was zu einer spürbaren Umkehrung der Wettbewerbslage geführt hat.
- Kurz nach der Vorstellung von Gemini stieg die Bewertung von Google, und die Leistung wurde am Markt stark hervorgehoben.
Seit der Einführung des Bildgenerierungsmodells Nano Banana im August sind die monatlich aktiven Google-KI-Nutzer innerhalb weniger Monate deutlich gestiegen:
- von 450 Millionen im Juli auf 650 Millionen im Oktober.
Auch Anthropic weitet sich im Unternehmenskundensegment aus, wodurch der Trend zu einer Abnahme von OpenAIs Alleinführerschaft sichtbar wird.
Die „Code-Red“-Situation, die Google kurz nach dem Start von ChatGPT selbst ausrief, wird nun als eine ironische Rollenverschiebung zugunsten von OpenAI beschrieben.

Investitionen, finanzieller Druck und Marktunsicherheit

OpenAI hat mit Microsoft und Amazon Verträge über datacenterbezogene Stromkapazitäten von 36 GW abgeschlossen, was
- in Zukunft jährliche Datacenter-Mietkosten von rund 620 Milliarden Dollar nach sich ziehen könnte.
Eine interne Projektion sieht vor, dass für die Gewinnschwelle 2030 ein jährlicher Umsatz von etwa 200 Milliarden Dollar erforderlich ist.
Obwohl OpenAI keine Börsennotierung plant,
- ist dieses Finanzmodell eng mit den Aktienkursen bedeutender Tech-Unternehmen wie Nvidia, Oracle und Microsoft verbunden und wirkt sich damit auf den gesamten Markt aus.
OpenAI ist weiterhin unprofitable und gilt weiterhin als auf eine kontinuierliche, großvolumige Finanzierung angewiesen, um wirtschaftlich zu überleben.

Neue Modellankündigung und interner Optimismus

Altman schrieb in der internen Notiz, dass das nächste Woche angekündigte neue Reasoning-Modell vor der neuesten Gemini-Version von Google liegt.
- Das wird als intern motivierender Faktor gesehen und unterstreicht OpenAIs Ambition, das Wachstum von ChatGPT zu sichern und die Führung zurückzugewinnen.
ChatGPT verfügt weiterhin über mehr als 800 Millionen wöchentliche Nutzer,
- OpenAI plant, dieses Fundament durch weitere Verbesserungen bei Geschwindigkeit, Genauigkeit und Personalisierung zu stärken.

Gesamter Kontext

In der Kombination aus zunehmender Konkurrenz (Google und Anthropic), Qualitätsdebatten bei den Produkten und hohen Infrastrukturkosten wird klar, dass
die Wiederherstellung der Kernqualität von ChatGPT die Überlebensstrategie und die dringendste Priorität von OpenAI ist.

3 Kommentare

slowandsnow 2025-12-04

Probleme von chatgpt
Zu viele Bugs. Man drückt auf Senden, aber es wird keine Nachricht generiert, oder während des Nachrichten-Streamings tritt ein Fehler auf und alles verschwindet usw. Deep Research hat sogar weniger Quellen als der Denkmodus. Es gibt keinen Grund mehr, Deep Research zu verwenden.
Probleme von codex
Viel zu langsam. Aufgaben, die in Claude Code 5 Minuten dauern, brauchen in Codex mehr als 10 Minuten. Viel zu dumm.

yinn27 2025-12-04

Aber ist Gemini nicht insgesamt, was etwa die UI angeht, umständlicher zu benutzen als ChatGPT..?

GN⁺ 2025-12-03

Hacker-News-Kommentare

Letzte Woche schickte ein Kunde eine Anfrage zu einer Funktion, die ich teilweise geschrieben hatte. Ein Support-Ingenieur erzeugte die Antwort mit Claude; obwohl es mit internen und öffentlichen Dokumenten trainiert worden war, produzierte es mit großer Sicherheit plausibel klingenden Unsinn
Während ich erklärte, warum das falsch war, ließ ein anderer Ingenieur es mit Augment laufen, und diesmal kam wieder selbstsicher ein anderer Unsinn heraus. Am Ende schickten wir nur noch weinende Emojis hin und her, und ich werde auch weiterhin meine eigene Intelligenz benutzen
- Mein Code braucht 0,11 Sekunden, der Code von Gemini 0,5 Sekunden. Mein Chef fragt nach dem Grund, aber ich weiß nicht, wie ich das erklären soll ¯\(ツ)/¯
- LLMs sind bei unmöglichen Aufgaben wirklich schwach. Manchmal ist es besser, die von ihren Halluzinationen erfundenen Features einfach tatsächlich zu implementieren. Einige öffentliche API-Anbieter machen das bereits
Ich habe das Gerücht gehört, dass OpenAI seit Mitte 2024 kein erfolgreiches pre-training mehr hinbekommen hat. Wenn man ChatGPT 5.1 ohne Internet nach aktuellen Ereignissen fragt, liegt der Knowledge Cutoff angeblich bei Juni 2024. Ich weiß nicht, ob das an einem kleineren Modell liegt, aber 18 Monate Rückstand wirken zum jetzigen Zeitpunkt wie ein beunruhigendes Signal
- Im SemiAnalysis-Newsletter stand dasselbe, und es wurde nie dementiert
- Wenn ich gelegentlich versuche, mit GPT-Modellen zu coden, wirkt es durch den knappen Gesprächsstil für ein paar Tage gut. Am Ende ist die Qualität aber schlechter als bei Claude oder Gemini, und es gibt mehr Fehlermuster
- Ich fragte ChatGPT 5.1 nach einem codex CLI-Installationsproblem, und es behauptete selbstsicher, codex sei eingestellt worden und ich hätte den Befehl openai falsch benutzt
- Google hatte Anfang der 2000er ebenfalls Probleme mit Verzögerungen beim Web-Crawling und hat trotzdem überlebt. Allerdings ist OpenAI heute nicht in einer so differenzierten Position wie Google damals, daher könnte die Lage viel riskanter sein
- Ich fragte, ob ich Indiana Jones lieber auf PS5 oder PC spielen sollte; zuerst hielt es das für einen Tippfehler, suchte dann irgendwann im Internet nach und lobte meine Gaming-Liga
Es wirkt, als hätten die seit dem letzten Jahr anhaltenden Abgänge zentraler OpenAI-Forscher jetzt wirklich Auswirkungen. Sam Altman ist ein Verkäufer, kein Forscher. Ilya ist weg, und wichtige Leute sind zu Google, Meta oder Anthropic gewechselt oder haben gegründet. Die Verbliebenen sind stark bei iterativen Verbesserungen, aber ob sie den nächsten Sprung selbst anführen können, ist fraglich
Das heutige OpenAI wirkt wie Netscape. Innovativ, aber ohne nachhaltiges Erlösmodell. Auf der einen Seite bündelt Google wie selbstverständlich AI kostenlos in bestehende Produkte, auf der anderen drücken Deepseek und Qwen als Open Source die Preise. Am Ende steht OpenAI von beiden Seiten unter Druck
- OpenAI soll dieses Jahr 20 Milliarden Dollar Jahresumsatz übertreffen (CNBC-Artikel)
- Wenn OpenAI bei der Kommerzialisierung scheitert und zu einem Non-Profit-Modell zurückkehrt, um kostenlose Tools zu teilen, würde es den Weg von Mozilla gehen
- Es heißt, „Google werde Gemini kostenlos bündeln“, aber ich habe den Eindruck, dass sie das bereits in fast allen Produkten tun
- Meine Frau weigert sich, zu Claude zu wechseln. Sie hat das Gefühl, dass ChatGPT perfekt auf ihren Geschmack getunt ist
- Um Gemini kostenlos zu bündeln, müssten die Inferenzkosten von Flash 3.0 deutlich niedriger sein als bei 2.5
Etwas interessiert mich wirklich: Wie kann OpenAI beim pre-training scheitern? Sie haben es doch schon erfolgreich gemacht, haben Top-Leute, also müsste man nicht einfach das Modell von 2024 noch einmal trainieren können?
- Aus demselben Grund, aus dem alle scheitern. Man passt Hyperparameter an neue Hardware an, übernimmt Verbesserungen aus Papers, und nach Monaten sowie Millionen Dollar flacht der Loss ab, während die Ergebnisse minimal bleiben
- Wenn „erfolgreich“ heißt, gegenüber dem vorherigen Modell spürbar bessere Leistung zu liefern, dann ist das wirklich schwer
- Ich habe gehört, GPT-4.5 sei so ein Versuch gewesen. Es wurde nur nicht veröffentlicht, weil die Leistung nicht gereicht hat
- Neue Modelle werden nicht auf dem vorherigen Modell weitertrainiert. Weil die Architektur komplett anders ist. Diesmal könnte das Design so schlecht gewesen sein, dass es schlechter wurde als das Modell von Mitte 2024
Das, was ich als „Code Red“ erlebt habe, war meist nur ein beschönigender Ausdruck dafür, dass eine Firma insgesamt die Richtung verloren hatte. Das mittlere Management wusste nicht, was zu tun ist, und am Ende mussten die Ingenieure die Last tragen
- PMs und mittlere Manager zu feuern verhindert so eine Situation nicht. Das ist eine viel zu vereinfachte Sicht auf die Entscheidungsstrukturen großer Organisationen
- Ein richtiges Code Red müsste die Prioritäten des Unternehmens vereinheitlichen und Ingenieure auf Kernprojekte umverteilen
- In dem einzigen Fall, den ich erlebt habe, wurden tatsächlich PMs entlassen; danach traten unerwartete Probleme auf, und man nahm das mit „gut, dass wir diese Probleme jetzt kennen“ hin
- Es gibt auch die Illusion von Ingenieuren, dass „alle Probleme die Schuld anderer sind und alles gelöst wäre, wenn nur ich übrig bliebe“
- Dieses Code Red könnte auch ein Vorwand sein, um Monetarisierungsfunktionen zu stoppen. Ein Versuch, die Diskrepanz zur realistischen Unternehmensbewertung zu vermeiden
Das eigentliche Code Red ist nicht, dass Google OpenAI überholt hat, sondern dass sich gezeigt hat, dass die AI-Branche keinen Burggraben hat. Am Ende liefern sich alle einen Wettbewerb um den teuersten Bodensatz
- Solche Unternehmen werden ihre Verluste am Ende über Staatsaufträge oder indirekte Bailouts sozialisieren
- Ob die Leistung von Gemini 3 tatsächlich zu einer Abwanderung von ChatGPT-Nutzern geführt hat, ist unklar
- Ich verstehe nicht, warum Investoren von einem Kommodifizierungswettbewerb mit Verluststruktur begeistert sind. Ich war zu GPT-3/4-Zeiten selbst Fan, nutze inzwischen aber parallel Claude und Gemini. Meine Loyalität ist null
- Warum ist dann der Google-Aktienkurs nach dem Launch von Gemini 2.5 Pro so stark gestiegen?
- Ich dachte auch, OpenAI hätte irgendeine geheime Trainingstechnik, aber so etwas gab es nicht
OpenAI hat mit dem Stargate-Projekt und anderem langfristige Ausgaben in Höhe von 500 Milliarden Dollar zugesagt. 250 Milliarden Dollar gehen an Microsoft Azure, außerdem sollen weitere Milliarden in AMD-GPUs fließen. Oracle hat dafür 18 Milliarden Dollar Anleihen und 9,6 Milliarden Dollar Kredite aufgenommen
Falls OpenAI zurückfällt, könnte das diese Verträge nicht mehr tragen, und es entstünde das Risiko einer Ketteninsolvenz. Staatliche Eingriffe wären möglich
- Altman sagt zwar, es werde keinen Bailout geben, aber genau diese Aussage ist eine Strategie zur Vertrauensbildung
- 500 Milliarden Dollar sind eine Ausgabenzusage, kein Umsatz. Das ist ein großer Unterschied
- Ehrlich gesagt hoffe ich eher, dass ein festgefahrener Kongress solche Bailouts verhindert
- Das meiste davon sind unverbindliche LOIs, also keine so festen Zusagen, wie es klingt
- Mit der LLM-Architektur ist AGI womöglich nicht erreichbar. Wenn keine alternative Struktur entwickelt wird, könnten all diese Verträge bedeutungslos werden
OpenAI soll Projekte wie Werbung, Shopping, Health Agents und Pulse verschieben und sich auf Verbesserungen bei ChatGPT konzentrieren. Grundsätzlich ist es aber so, dass es nur wenige Schlüsselkräfte gibt, während der Rest Werbung oder kommerzielle Funktionen übernehmen kann. Das muss sich nicht gegenseitig behindern
- Der Engpass ist nicht die Zahl der Leute, sondern der strategische Denkspielraum der Führung
- Vielleicht liegt das Problem nicht an der Produktqualität, sondern an der Fähigkeit zum Ökosystemaufbau. Google ist bereits in Alltagswerkzeuge integriert
- Die LLM-Entwicklung hat zwei Ebenen: ① Low-Level-Architektur ② Anwendungs- und Verifikationssysteme. Letztere tragen durch automatisierte Erzeugung von Verifikationsdaten zur Verbesserung des Kernmodells bei
- „Verschiebung“ könnte auch einfach eine Umverteilung von Rechenressourcen statt eines vollständigen Stopps bedeuten
- Aus Sicht der Verbraucher bleibt zu hoffen, dass dieser Wettbewerb zu besserer Modellqualität führt
Laut WSJ verschiebt OpenAI Werbung, AI für Gesundheit und Shopping sowie den persönlichen Assistenten Pulse. Zusammen mit der Hardware-Zusammenarbeit mit Jony Ive wirkt das wie verzettelte Fokussierung
- Darüber hinaus wurden auch Projekte wie ein soziales Netzwerk oder ein Browser angekündigt
- Um mit Google zu konkurrieren, ist der Eintritt in den Werbemarkt am wichtigsten. Sonst fließen die Werbebudgets zu Meta, Amazon und Google ab
- Letztlich sind Werbung und Siri-/Alexa-artige Assistenten der Kern, deshalb ist es seltsam, genau das zu verschieben
- Es geht nicht nur um verlorenen Fokus; OpenAI ist inzwischen auch ein auf kurzfristige Ergebnisse ausgerichtetes Unternehmen geworden. Gegen einen Gegner wie Google, der dieses Spiel seit 25 Jahren spielt, wird es schwer. Mit Hardware-Erweiterungen allein gibt es Grenzen
- Eigentlich geht es hier nicht um Konkurrenz zu Google, sondern darum, dass Werbung zum Überlebenstest für OpenAI wird.
  Wenn Werbung Geld verdient, wird OpenAI ein Unternehmen auf Mag-7-Niveau; wenn nicht, zeigt sich die Realität.
  Falls die Werbeexperimente bereits schlechter als erwartet liefen, könnte „Code Red“ auch ein Signal zum Zeitgewinn sein, um das zu kaschieren.
  ChatGPT ist kein Einstiegspunkt für Suche wie Google und ermöglicht auch keine Feed-basierte Werbung wie Meta.
  Am Ende ist die Wahrscheinlichkeit groß, dass sich Alexas Scheitern wiederholt.