GPT‑5.5 Instant

(openai.com)

2 Punkte von GN⁺ 2026-05-07 | 1 Kommentare | Auf WhatsApp teilen

Das Standardmodell Instant von ChatGPT wurde von GPT‑5.3 Instant auf GPT‑5.5 Instant aktualisiert, wird schrittweise für alle Nutzer bereitgestellt und zielt auf genauere, knappere und stärker personalisierte Antworten ab
In internen Bewertungen von OpenAI verringerte GPT‑5.5 Instant halluzinierte Behauptungen bei Hochrisiko-Prompts wie Medizin, Recht und Finanzen im Vergleich zu GPT‑5.3 Instant um 52,5 %, und ungenaue Aussagen in schwierigen Gesprächen, die von Nutzern als sachlich falsch markiert wurden, gingen um 37,3 % zurück
Verbessert wurden die Analyse von Foto- und Bild-Uploads, STEM-Fragen, die Entscheidung, wann Websuche für nützlichere Antworten eingesetzt werden sollte, sowie visuelles Schlussfolgern, Mathematik und wissenschaftliche Bewertungen; im Mathematikbeispiel wurde ein Fehler beim Umstellen von Termen gefunden und das Ergebnis x = (3 + √33) / 2 erreicht
GPT‑5.5 Instant wurde so angepasst, dass es kurze, fokussierte Antworten liefert, ohne die Kernaussagen zu verlieren, und Redundanz, übermäßige Formatierung, unnötige Rückfragen und den unnötigen Einsatz von Emojis reduziert
Es nutzt den Kontext aus früheren Chats, Dateien und verbundenem Gmail besser für Personalisierung, und mit der neuen Funktion memory sources lassen sich verwendete gespeicherte Erinnerungen oder Teile früherer Chats einsehen, löschen oder bearbeiten

Umfang des Updates und Ausrichtung der Antworten

Das Standardmodell Instant von ChatGPT wechselt von GPT‑5.3 Instant zu GPT‑5.5 Instant und wird allen Nutzern zur Verfügung gestellt
Instant ist das Modell, das täglich von Hunderten Millionen Menschen genutzt wird, daher können schon kleine Verbesserungen einen großen Einfluss auf den Nutzen und die Zufriedenheit in alltäglichen Interaktionen haben
Dieses Update richtet sich auf stärkere und kompaktere Antworten über viele Themen hinweg, einen natürlicheren Gesprächston und eine bessere Nutzung bereits geteilter Kontexte, wenn Personalisierung hilfreich ist

Verbesserungen bei Genauigkeit und Schlussfolgern

GPT‑5.5 Instant hat insgesamt an Faktentreue gewonnen und zeigt die größten Fortschritte in Bereichen, in denen Genauigkeit besonders wichtig ist
In internen Bewertungen von OpenAI erzeugte GPT‑5.5 Instant bei Hochrisiko-Prompts in Medizin, Recht und Finanzen 52,5 % weniger halluzinierte Behauptungen als GPT‑5.3 Instant
In besonders schwierigen Gesprächen, die Nutzer als sachlich fehlerhaft markiert hatten, wurden ungenaue Aussagen um 37,3 % reduziert
Auch bei Alltagsaufgaben wurde das Modell leistungsfähiger, etwa bei der Analyse hochgeladener Fotos und Bilder, bei Antworten auf STEM-Fragen und bei der Entscheidung, wann Websuche eingesetzt werden sollte, um nützlichere Antworten zu liefern
Auch bei Bewertungen zu visuellem Schlussfolgern, Mathematik und Wissenschaft zeigen sich Verbesserungen

Beispiel für eine Mathematikantwort

Antwort von GPT‑5.3 Instant
- In einem Beispiel mit einer Wurzelgleichung, bei dem der Nutzer fragte, ob sein Lösungsweg korrekt sei, antwortete GPT‑5.3 Instant zunächst, dass Quadrieren, Ausmultiplizieren, Faktorisieren und die Prüfung des Definitionsbereichs korrekt seien
- Danach setzte es x = 3 in die ursprüngliche Gleichung ein, stellte fest, dass √10 ≠ 2 ist, und bewertete dies als durch das Quadrieren entstandene Scheinlösung
- Es endete jedoch mit der falschen Schlussfolgerung, dass es keine reelle Lösung gibt, und verfolgte den eigentlichen algebraischen Fehler nicht weiter zurück
Antwort von GPT‑5.5 Instant
- GPT‑5.5 Instant bestätigte zunächst ebenfalls den Lösungsweg des Nutzers, erkannte aber beim Einsetzen von x = 3 in die ursprüngliche Gleichung den Fehler √10 ≠ 2
- Anschließend stellte es fest, dass die Ursache des Problems nicht nur die Scheinlösung war, sondern auch ein Fehler beim Umstellen der Terme, und korrigierte x + 7 = (x - 1)^2 zu 0 = x^2 - 3x - 6
- Mit der Mitternachtsformel erhielt es x = (3 ± √33) / 2 und gab unter der Bedingung x ≥ 1 die gültige Lösung (3 + √33) / 2 an
- Die Antwort von GPT‑5.5 Instant erholte sich also von dem anfänglichen Fehler, fand den tatsächlichen algebraischen Fehler und gelangte zur korrekten Lösung

Prägnantere Kommunikation

GPT‑5.5 Instant wurde so angepasst, dass es kürzere, fokussierte Antworten liefert, ohne die Kernaussagen zu verlieren
Die Wärme und Persönlichkeit, die ChatGPT angenehm nutzbar machen, bleiben erhalten, zugleich vermittelt es dieselben Informationen nützlicher als das vorherige Modell und reduziert Redundanz sowie übermäßige Formatierung
Es stellt seltener unnötige Rückfragen und vermeidet Elemente, die Antworten unübersichtlich machen, etwa unnötige Emojis
In einem Beispiel, in dem gefragt wurde, wie man einem Kollegen sagen kann, dass er sich kürzer fassen soll, verwendete GPT‑5.5 Instant im Vergleich zu GPT‑5.3 Instant 30,2 % weniger Wörter und 29,2 % weniger Zeilen
GPT‑5.5 Instant behält dabei einen informellen, praktischen und für den Arbeitsplatz sicheren Ton bei, liefert Formulierungen für verschiedene Situationen und behandelt das Problem als Frage der Grenzsetzung statt des Charakters des Kollegen
GPT‑5.3 Instant war mit einem Abschnitt „Was man nicht tun sollte“ zwar vollständiger, wirkte für einen lockeren Beratungs-Prompt jedoch etwas zu stark strukturiert und ausgearbeitet

Personalisierung und Kontrolle

Instant nutzt den Kontext aus früheren Chats, Dateien und verbundenem Gmail effektiver, um Antworten persönlicher anzupassen
Es erkennt intelligent, wann zusätzliche Personalisierung eine Antwort verbessern kann, und durchsucht frühere Unterhaltungen schneller nach passendem Kontext, damit Nutzer sich nicht wiederholen müssen
Das ist besonders nützlich bei individuellen Empfehlungen und Plänen oder wenn laufende Aufgaben fortgesetzt werden
In einem Beispiel zur Empfehlung eines Autos berücksichtigte GPT‑5.3 Instant, dass sich der Nutzer in San Francisco befindet, und gab allgemeine ortsbezogene Empfehlungen
GPT‑5.5 Instant nutzte dagegen früheren Kontext dazu, dass der Nutzer häufig zum Asha Tea House geht und klare taiwanesische/high-mountain teas gegenüber sehr süßem Boba bevorzugt, und empfahl dadurch präziser Ceré Tea, Song Tea & Ceramics, Tea Rex Cafe & Specialty Teas und Stonemill Matcha

memory sources

Für alle ChatGPT-Modelle wird memory sources eingeführt, eine neue Steuerungsfunktion, mit der sichtbar wird, welcher Kontext für die Personalisierung einer Antwort verwendet wurde
Wenn eine Antwort personalisiert ist, lässt sich prüfen, welcher Kontext verwendet wurde, etwa gespeicherte Erinnerungen oder frühere Chats, und veraltete oder nicht mehr relevante Inhalte können gelöscht oder bearbeitet werden
In geteilten Chats wird memory sources anderen Personen nicht angezeigt
Nutzer können Chats löschen, die nicht mehr zitiert werden sollen, in den Einstellungen gespeicherte Erinnerungen löschen oder ändern oder temporäre Chats verwenden, die Erinnerungen weder nutzen noch aktualisieren
memory sources soll Personalisierung leichter verständlich machen, zeigt aber möglicherweise nicht immer alle Faktoren an, die eine Antwort beeinflusst haben
Unter sources werden womöglich nicht alle gesuchten oder referenzierten früheren Chats angezeigt, sondern nur einige der relevantesten; diese Ansicht soll im Lauf der Zeit umfassender werden

Zeitplan für die Bereitstellung

GPT‑5.5 Instant wird ab heute schrittweise an alle ChatGPT-Nutzer ausgerollt und ersetzt GPT‑5.3 Instant als Standardmodell
In der API ist es unter chat-latest verfügbar
Zahlende Nutzer können GPT‑5.3 Instant über die Modelleinstellungen noch drei Monate weiterverwenden, danach wird GPT‑5.3 Instant eingestellt
Die verbesserte Personalisierung auf Basis früherer Chats, Dateien und verbundenem Gmail wird schrittweise für Plus- und Pro-Nutzer im Web bereitgestellt und soll bald auch auf Mobilgeräten verfügbar sein
Eine Ausweitung auf Free, Go, Business und Enterprise ist in den kommenden Wochen geplant
memory sources wird bereits schrittweise für alle ChatGPT-Consumer-Pläne im Web ausgerollt und soll bald auch auf Mobilgeräten verfügbar sein
Die Verfügbarkeit bestimmter Personalisierungsquellen kann je nach Region variieren

1 Kommentare

GN⁺ 2026-05-07

Hacker-News-Kommentare

Wenn man Unmittelbarkeit sehen will, sollte man sich einmal chatjimmy.ai ansehen. Ich habe nichts damit zu tun, aber die Möglichkeiten, die sich dadurch für das Produkt eröffnen, an dem ich arbeite, sind ziemlich verblüffend
Wenn sogar mit deutlich älteren Modellen Inference im Millisekundenbereich möglich ist, verändert das die Lage komplett. Es ist so krass, dass man bei fast jedem API-Aufruf Inference laufen lassen könnte, ohne spürbare Latenz
- Gibt es dazu mehr Informationen? Ich fand Groq schon schnell, aber das hier ist absurd schnell
  Korrektur: Es war diese Firma https://taalas.com/products/
- Wenn man bei gpt-4.1 auf Latenzen im zweistelligen Millisekundenbereich käme, wäre das wirklich ein Gamechanger
GPT-5.3-instant war überhaupt nicht instant. Selbst mit minimalem Reasoning-Aufwand war TTFT im besten Fall etwa 3- bis 4-mal langsamer als bei GPT-4.1
Den Namen „instant“ haben sie sich natürlich selbst gegeben. Es gibt einen echten Bedarf, den Arbeitstier-Status von GPT-4.1 im Rechenzentrum endlich abzulösen
Und wenn man ein „instant“-Modell veröffentlicht, aber die Latenzeigenschaften mit keinem Wort erwähnt, fragt man sich schon, was das soll
Ich frage mich, worin genau der Unterschied dazu besteht, bei GPT 5.5 thinking den Reasoning-Aufwand auf 0 zu setzen. Die Produktentscheidung, das in getrennte Modelle aufzuteilen, ist interessant
- Gute Frage. GPT-5.5 thinking ist sehr gut darin, bei einfachen Fragen nicht nachzudenken, daher hatte ich selbst für schnelle Q&A nie das Gefühl, ein instant-Modell zu brauchen
  Dann ist das instant-Modell vermutlich ein völlig anderes, kleineres Modell und wohl vor allem dafür gedacht, die kostenlose ChatGPT-Stufe zu bedienen
Kann man das auch in der API nutzen? Ich sehe kein instant, nur chat
- GPT‑5.5 Instant is rolling out starting today to all ChatGPT users, replacing GPT‑5.3 Instant as the default model, and in the API as chat-latest.
Die Antworten wirken besser lesbar, und hoffentlich sind sie das auch wirklich. Das normale kostenlose ChatGPT-Modell ist derzeit kaum zu ertragen
Damit steigt die Intelligenz in der günstigsten Preisklasse deutlich
- Günstig wirklich? https://developers.openai.com/api/docs/pricing listet chat-latest mit $5/$30 für Input/Output, also zum gleichen Preis wie gpt-5.5
- Wo steht denn der Preis? Auf der Modellseite scheint es noch nicht einmal aufgeführt zu sein
Warum schaffen sie es nicht, zu jeder Versionsnummer Instant- und Thinking-Modelle gleichzeitig und konsistenter zu veröffentlichen? Ich verstehe nicht, warum man so ein doppeltes Durcheinander erzeugt
- Wahrscheinlich ist das eine überarbeitete Version des thinking-Modells. In dem Fall hätte man den Release des thinking-Modells verschieben müssen, um beides gleichzeitig herauszubringen
Schön. Da ist tatsächlich etwas gekommen, das man sinnvoll nutzen kann und das bezahlbar ist

GPT‑5.5 Instant

Umfang des Updates und Ausrichtung der Antworten

Verbesserungen bei Genauigkeit und Schlussfolgern

Beispiel für eine Mathematikantwort

Antwort von GPT‑5.3 Instant

Antwort von GPT‑5.5 Instant

Prägnantere Kommunikation

Personalisierung und Kontrolle

memory sources

Zeitplan für die Bereitstellung

Verwandte Beiträge

1 Kommentare

Hacker-News-Kommentare