GPT-5.2 und GPT-5.2-Codex sind jetzt 40 % schneller
(twitter.com/OpenAIDevs)- Die Verarbeitungsgeschwindigkeit der Modelle GPT-5.2 und GPT-5.2-Codex wurde im Vergleich zu bisher um 40 % verbessert
- Der Inferenz-Stack wurde für alle API-Nutzer optimiert
- Dasselbe Modell und dieselben Gewichte, aber mit geringerer Latenz
1 Kommentare
Hacker-News-Kommentare
Im vergangenen Monat hat OpenAI für Codex-Nutzer mehrere Funktionen veröffentlicht
Schon die ersten beiden Funktionen allein fühlen sich nach einer Verdreifachung der Produktivität an. Ich freue mich wirklich auf dieses Update
Ich habe am Wochenende denselben Prompt mit GPT-5.2, Gemini 3, Grok ausgeführt
Gemini 3 und Grok waren im „Thinking Mode“ in unter 2 Minuten fertig, während GPT-5.2 6 Minuten lang auf der Stelle trat
Kürzlich soll roon bemerkt haben, dass Mitarbeiterkonten viel schneller sind als normale Nutzerkonten
Dadurch wurde offenbar klar, dass interne API-Aufrufe effizienter ausgeführt werden können als die von normalen Nutzern
Letztlich werden normale Nutzer also nur noch aus der verbleibenden Kapazität bedient
Verwandter Artikel: Choose Your Fighter (The Zvi)
Meiner Meinung nach hat OpenAI die Gewohnheit, nach der Veröffentlichung eines Modells die Qualität absichtlich zu senken
Die Webversion von ChatGPT 5.2 war anfangs viel besser, aber nach 1–2 Wochen fiel die Qualität plötzlich ab
Das wirkte wie eine Strategie, um Medien und Benchmarks zu täuschen
Um die Geschwindigkeit zu erhöhen, muss man einfach nur die Inferenzintensität senken, deshalb fällt es mir schwer, der Aussage von 40 % Verbesserung zu glauben
Es könnte auch so ein „Trick“ sein, bei dem ChatGPT-Plus-Nutzer anfangs das Pro-Modell bekommen und später auf Standard umgestellt werden
Wir halten die Modellqualität konstant und untersuchen Berichte über Leistungsabfall sofort
Diese Geschwindigkeitssteigerung kommt durch eine verbesserte Verarbeitungszeit pro Token zustande; Modellqualität und Gewichte sind unverändert
Siehe: Claude Code Tracker (MarginLab)
Interessant ist, dass die Inferenzkosten bei Cerebras viel höher sind, der Preis aber gleich geblieben ist
Wenn es Cerebras wäre, hätte sich das Modellverhalten verändert und die Geschwindigkeit wäre etwa 10-mal höher
Vermutlich wurde ein neuer optimierter Kernel für die Blackwell-Serie geschrieben
Die Geschwindigkeit war immer mein größter Kritikpunkt, aber durch diese Verbesserung denke ich darüber nach, es noch einmal zu verwenden
Ich frage mich, wie sie diese Geschwindigkeitssteigerung erreicht haben
Auch auf Reddit gibt es viele Beiträge darüber, dass die Qualität nachgelassen hat
In Claude-bezogenen Subreddits ist es genauso, und wirklich belastbare Belege gibt es kaum