4 Punkte von GN⁺ 2026-02-05 | 1 Kommentare | Auf WhatsApp teilen
  • Die Verarbeitungsgeschwindigkeit der Modelle GPT-5.2 und GPT-5.2-Codex wurde im Vergleich zu bisher um 40 % verbessert
  • Der Inferenz-Stack wurde für alle API-Nutzer optimiert
  • Dasselbe Modell und dieselben Gewichte, aber mit geringerer Latenz

1 Kommentare

 
GN⁺ 2026-02-05
Hacker-News-Kommentare
  • Im vergangenen Monat hat OpenAI für Codex-Nutzer mehrere Funktionen veröffentlicht

    • Unterstützung für Subagents
    • verbesserte Multi-Agent-Oberfläche (Codex app)
    • 40 % schnellere Inferenzgeschwindigkeit
      Schon die ersten beiden Funktionen allein fühlen sich nach einer Verdreifachung der Produktivität an. Ich freue mich wirklich auf dieses Update
    • Ich frage mich, wie sie die Subagents zum Laufen bringen
    • Das ist eine nur für die API verfügbare Funktion
    • Wenn man Claude verwendet, verbessert sich die Leistung ungefähr um x². OpenAI dürfte dadurch wohl etwas unter Druck geraten
  • Ich habe am Wochenende denselben Prompt mit GPT-5.2, Gemini 3, Grok ausgeführt
    Gemini 3 und Grok waren im „Thinking Mode“ in unter 2 Minuten fertig, während GPT-5.2 6 Minuten lang auf der Stelle trat

  • Kürzlich soll roon bemerkt haben, dass Mitarbeiterkonten viel schneller sind als normale Nutzerkonten
    Dadurch wurde offenbar klar, dass interne API-Aufrufe effizienter ausgeführt werden können als die von normalen Nutzern
    Letztlich werden normale Nutzer also nur noch aus der verbleibenden Kapazität bedient
    Verwandter Artikel: Choose Your Fighter (The Zvi)

  • Meiner Meinung nach hat OpenAI die Gewohnheit, nach der Veröffentlichung eines Modells die Qualität absichtlich zu senken
    Die Webversion von ChatGPT 5.2 war anfangs viel besser, aber nach 1–2 Wochen fiel die Qualität plötzlich ab
    Das wirkte wie eine Strategie, um Medien und Benchmarks zu täuschen
    Um die Geschwindigkeit zu erhöhen, muss man einfach nur die Inferenzintensität senken, deshalb fällt es mir schwer, der Aussage von 40 % Verbesserung zu glauben
    Es könnte auch so ein „Trick“ sein, bei dem ChatGPT-Plus-Nutzer anfangs das Pro-Modell bekommen und später auf Standard umgestellt werden

    • Ich verstehe die skeptische Sichtweise, aber wir machen solche Täuschungen nicht
      Wir halten die Modellqualität konstant und untersuchen Berichte über Leistungsabfall sofort
      Diese Geschwindigkeitssteigerung kommt durch eine verbesserte Verarbeitungszeit pro Token zustande; Modellqualität und Gewichte sind unverändert
    • Das ist nicht nur bei OpenAI so. Auch bei Anthropic gibt es ähnliche Fälle
      Siehe: Claude Code Tracker (MarginLab)
    • Es wäre gut, eine tägliche Benchmark-Seite für Codex zu bauen
    • Man kann die Benchmarks einfach selbst noch einmal laufen lassen
  • Interessant ist, dass die Inferenzkosten bei Cerebras viel höher sind, der Preis aber gleich geblieben ist

    • Allerdings ist es wahrscheinlich nicht Cerebras.
      Wenn es Cerebras wäre, hätte sich das Modellverhalten verändert und die Geschwindigkeit wäre etwa 10-mal höher
      Vermutlich wurde ein neuer optimierter Kernel für die Blackwell-Serie geschrieben
    • Es läuft mit ziemlicher Sicherheit nicht auf Cerebras
  • Die Geschwindigkeit war immer mein größter Kritikpunkt, aber durch diese Verbesserung denke ich darüber nach, es noch einmal zu verwenden

  • Ich frage mich, wie sie diese Geschwindigkeitssteigerung erreicht haben

  • Auch auf Reddit gibt es viele Beiträge darüber, dass die Qualität nachgelassen hat

    • Aber auf Reddit erscheinen solche Beiträge jeden Tag.
      In Claude-bezogenen Subreddits ist es genauso, und wirklich belastbare Belege gibt es kaum