1 Punkte von GN⁺ 2026-02-01 | 2 Kommentare | Auf WhatsApp teilen
  • Ab dem 13. Februar 2026 wird die Unterstützung für GPT‑4o/4.1/4.1 mini/o4‑mini in ChatGPT eingestellt
  • Dies erfolgt zusammen mit dem bereits angekündigten Rückzug von GPT‑5 (Instant, Thinking, Pro), an der API gibt es keine Änderungen
  • OpenAI arbeitet weiter an Verbesserungen von ChatGPT, darunter mehr Freiraum für erwachsene Nutzer sowie weniger unnötige Ablehnungen und übermäßige Warnhinweise

Zeitplan und Umfang der Modell-Abkündigung

  • Am 13. Februar 2026 werden GPT‑4o, GPT‑4.1, GPT‑4.1 mini und OpenAI o4‑mini in ChatGPT außer Betrieb genommen
    • Dieser Termin fällt mit der bereits angekündigten Abkündigung von GPT‑5 (Instant, Thinking, Pro) zusammen
    • Für den API-Dienst gibt es derzeit keinerlei Änderungen

Hintergrund zu GPT‑4o und Nutzerfeedback

  • GPT‑4o ist ein Modell, das nach einer vorübergehenden Abschaltung wiederhergestellt wurde; im Zuge der Wiederherstellung wurde das Nutzungsverhalten analysiert
    • Einige Plus- und Pro-Nutzer baten um mehr Zeit, um wichtige Anwendungsfälle umzustellen
    • Besonders häufig wurde die Vorliebe für kreative Ideenfindung und einen warmen Gesprächsstil genannt
    Anzeige
  • Dieses Feedback floss direkt in die Entwicklung von GPT‑5.1 und GPT‑5.2 ein
    • Verbesserungen bei der Persönlichkeit (personality), Unterstützung kreativer Ideenfindung und Funktionen zur Anpassung des Antwortstils wurden hinzugefügt
    • Nutzer können Basistöne wie Friendly wählen und den Grad an Wärme und Begeisterung anpassen

Gründe für die Abkündigung von GPT‑4o

  • Der Rückzug von GPT‑4o erfolgt, weil der Wechsel der meisten Nutzung auf GPT‑5.2 weitgehend abgeschlossen ist
    • Derzeit nutzen nur 0,1 % der täglichen Nutzer GPT‑4o
    • Da verbesserte Funktionen bereits eingeführt wurden, ist die Notwendigkeit, das ältere Modell weiterzuführen, gering
Anzeige

Allgemeine Verbesserungsrichtung für ChatGPT

  • OpenAI verbessert auf Basis von Nutzerfeedback fortlaufend Persönlichkeit, Kreativität und Antwortqualität
    • Geplant sind Updates, die unnötige Ablehnungen sowie übermäßig vorsichtige oder belehrende Antworten reduzieren
  • Zudem wird an einer ChatGPT-Version für Erwachsene (ab 18 Jahren) gearbeitet
    • Nach dem Grundsatz, Erwachsene als Erwachsene zu behandeln, sollen Wahlmöglichkeiten und Freiräume erweitert werden
    • Zur Unterstützung wurde in den meisten Märkten eine Altersprognose-Funktion für Nutzer unter 18 Jahren eingeführt

Hinweise für Nutzer und weitere Pläne

  • OpenAI will bei Modelländerungen klare Zeitpläne und Änderungen im Voraus ankündigen
  • Das Unternehmen erkennt an, dass manche Nutzer das Ende des Zugangs zu GPT‑4o als Unannehmlichkeit empfinden könnten
  • Dennoch ist die Abkündigung von Modellen eine Maßnahme, um sich auf die Verbesserung der aktuell hauptsächlich genutzten Modelle zu konzentrieren

2 Kommentare

 
grenade 2026-02-02

Ich habe o4-mini persönlich gern genutzt, daher ist das wirklich schade.

 
GN⁺ 2026-02-01
Hacker-News-Kommentare
  • Viele sagen, dass sie zu Claude zurückkehren, aber ich bin in letzter Zeit mit ChatGPT eher zufrieden
    Seit letztem Dezember scheint Anthropic etwas geändert zu haben, und selbst wenn ich in meinem Pro-Plan nur Sonnet nutze, stoße ich oft an das Wochenlimit
    ChatGPT dagegen lässt sich selbst im $20-Plan fast ohne Einschränkungen nutzen, und auch beim Coden im 5.2-codex-Modus ist es schnell genug

    • Beeindruckend fand ich, wie gut ChatGPT den Kontext früherer Gespräche erfasst
      Selbst in neuen Chats erkennt es, für welches Projekt ich etwas verwenden will, und erstellt passende Beispiele
      Die Antworten wirken etwas wärmer und persönlicher
    • Ich fand es auch seltsam, dass ich bei Sonnet oft ans Wochenlimit gestoßen bin
      Als die Kapazität Ende Dezember vorübergehend erhöht wurde, war es okay, aber danach hatte ich eher das Gefühl, dass es schneller aufgebraucht war
      Vielleicht lag es auch daran, dass sich meine Nutzungsgewohnheiten damals verändert haben
    • Es wirkt, als hätte Anthropic über die Feiertage die Nutzung steigern wollen
      Wegen des hohen Tokenverbrauchs von Opus und der merkwürdigen Nutzungsberichte habe ich den Verdacht, dass es eine Strategie war, Pro-Nutzer zu Max zu lenken
    • Opus wirkte bei Agenten oder im Planungsmodus noch halbwegs stabil
      Aber sobald man Rechte zum Ausführen von Tests oder Importieren von Paketen gibt, gerät es schnell durcheinander
      Es bleibt zum Beispiel stehen, weil es auf dem Mac keinen sleep-Befehl gebe, und rast dann los, ohne selbst um Hilfe bitten zu können
      Am Ende muss der Nutzer es selbst stoppen, wodurch der Kontext verloren geht
    • Ich nutze CC 20x, aber tatsächlich habe ich fast alle neue Software mit Codex (5.1-codex) im $20-Plan gebaut und große Erfolge erzielt
  • OpenAI sagt, dass es eine ChatGPT-Version für Nutzer ab 18 Jahren vorbereitet
    Für Minderjährige soll eine Altersschätzungsfunktion angewendet werden
    Offizieller Hilfelink

    • In der LLM-Branche war Erwachsenen-Content immer so etwas wie eine Notfallkarte, die man in finanziellen Krisen ausspielt
      Aber ich denke, dass personalisierte LLM-Pornos wegen ihrer verstärkungslernartig süchtig machenden Elemente negative Folgen haben können
    • Ich frage mich, was passiert, wenn jemand über 18 ist, das System ihn aber als minderjährig einstuft
      Umgekehrt ist es ebenfalls problematisch, wenn Minderjährige als Erwachsene erkannt werden
      Außerdem möchte ich auch als Erwachsener keiner unerwünschten Erwachsenen-Content-Exposition ausgesetzt werden
      Gefährliche virale Challenges oder auf Aussehen fixierte Inhalte bleiben unabhängig vom Alter schädlich
    • Ich glaube, dabei geht es nicht um Pornografie, sondern um Werbung
      Wahrscheinlich ist es ein Mechanismus, um Alkohol- und Pharmawerbung zu erlauben
    • Wahrscheinlich wird OpenAI das Verifizierungssystem vermasseln und danach mit einer Worldcoin-Integration kommen
      So nach dem Motto: „Verifiziere dein Alter ganz bequem mit Orb statt mit lästiger Authentifizierung“
      Am Ende läuft es auf ein Szenario hinaus, in dem Login ohne Orb nicht mehr möglich ist und silberne bzw. schwarze Modelle verkauft werden
    • Am Ende wird der Markt für intime Gespräche mit LLMs riesig sein
      Das Unternehmen, das diesen Markt zuerst besetzt, wird enorme Gewinne machen
  • OpenAI sagt, GPT‑4o sei zurückgekehrt, weil manche Nutzer die Wärme im Gespräch und kreative Ideen bevorzugten
    Das heißt: Nicht das Modell schmeichelt, sondern die Menschen wollen genau diesen Stil

    • Aus meiner Erfahrung mit Bevölkerungsdaten weiß ich, wie groß der Unterschied zwischen oberflächlichen Meinungen und tatsächlichem Verhalten sein kann
      Die Stimmung auf HN oder Reddit spiegelt nicht die Vorlieben aller Nutzer wider
    • Viele Nutzer bevorzugen ein „selbstbewusst falsches Modell“ gegenüber einem „präzisen, aber langweiligen Modell“
      Letztlich ist kaum jemand frei von Bestätigungsfehlern
    • Dieses Phänomen könnte auch daran liegen, dass Communities rund um AI-Girlfriends oder Nutzer von Replika-Apps besonders stark Feedback gegeben haben
      Sie hatten auch bei der Abschaffung früherer Modelle am lautesten protestiert
    • Ich war einer der Nutzer, die sich beschwert haben, als das o3-Modell verschwand
      o3 nutzte bei Datenanalyse-Prompts tabellarische Antworten gut, was deutlich lesbarer war
      5.2 setzt eher auf blogartige Absätze und ist dadurch weniger effizient
      Es wäre gut, wenn pro Nutzer gelernt würde, welches Format bevorzugt wird, und die Ausgabe entsprechend angepasst würde
    • Inzwischen gibt es sogar eine Einstellung, mit der sich „Wärme“ und „Begeisterungsgrad“ des Modells steuern lassen
      Das kann im Menü „Personalisation“ angepasst werden
      Wie stark das den Grad des Schmeichelns beeinflusst, teste ich aber noch
  • Seit das Wochenlimit des Thinking-Modells auf 3000 erhöht wurde, nutze ich nur noch das
    Dank des 200k-Kontextfensters bin ich sehr zufrieden
    Früher habe ich Gemini wegen des 1M-Token-Kontexts genutzt, aber inzwischen bin ich wieder bei ChatGPT
    Im Extended-Thinking-Modus sucht es Hunderte von Quellen und arbeitet fast wie Deep Research

    • Gemini 3 Pro durchsucht das Web kaum oder reagiert bei Fragen zum aktuellen Datum aggressiv
      Das Flash-Modell sucht dagegen häufiger zur Verifikation
      Vielleicht ist auch das eine Strategie, um Nutzer in die kostenpflichtige API zu drängen
    • Nach meiner Erfahrung war es eher Gemini, das am schnellsten und am meisten gesucht hat
      ChatGPT scheint inzwischen nur noch in Thinking-/Research-Modi zu suchen
  • Die GPT‑5-Reihe ist enttäuschend, weil sie zu weitschweifig und unlogisch ist
    Systemanweisungen werden schnell vergessen, und selbst wenn man um kurze Antworten bittet, kommen lange Listen
    Claude 4.5 wirkt sowohl im Gespräch als auch beim Coden viel natürlicher

    • Ich hatte 4.0 über ein Jahr lang trainiert, um meine Produktivität zu steigern, aber bei 5x ließ sich das nicht reproduzieren
      Das Modell erklärte, Weitschweifigkeit sei ein Nebeneffekt der Optimierungsziele
      Die neuen Modelle priorisierten Sicherheit und Vollständigkeit und seien deshalb von Natur aus gesprächiger geworden
    • Unser Unternehmen nutzt weiterhin 4.1
      Es ist charakterlich stabiler und berechenbarer und deshalb für Automatisierungsprojekte geeignet
      Die 5er-Reihe ist langsam und unnötig eigenwillig, also ohne geschäftlichen Mehrwert
    • Ich verstehe nicht, warum sie unbedingt so lange Texte erzeugen wollen
      Es fühlt sich an, als würden sie Anweisungen wie „kurz und klar“ ignorieren und einen mit Informationsüberladung bombardieren
    • ChatGPT 5 mini ohne Login ist fast nur noch auf dem Niveau von Mistral 7b + Websuche
      Es ist sogar schlechter als das frühere 3.5
    • 5.2 war für die Lösung technischer Probleme ungeeignet
      Statt eines kurzen Reports kamen nur negative und weitschweifige Ratschläge
      Deshalb bin ich zu Claude, LM Studio und gpt-oss gewechselt
      Fürs Coden ist Claude ohnehin schon mein Hauptwerkzeug
  • ChatGPT 5.2 war so schlecht, dass es für mich der Auslöser war, andere LLMs auszuprobieren
    Sowohl Genauigkeit als auch Befolgung von Anweisungen waren schwach, aber dadurch wuchs mein Interesse an Claude und lokalen Modellen

    • Bei ChatGPT ändert sich mit jeder Version die Persönlichkeit, sodass ich meinen Workflow jedes Mal anpassen musste
      Claude ist deutlich angenehmer, weil es selbst bei Modellwechseln konsistent bleibt
    • Würde mich interessieren, ob du es mit Gemini 3 verglichen hast
    • (halb im Scherz) Ich würde gern sagen: „Das bildest du dir ein, es ist immer noch das Beste /s“
  • Dass man ausgerechnet einen Tag vor dem Valentinstag das Modell für romantisches Rollenspiel entfernt hat, ist schon ironisch

    • Wenn an dem Tag ein ChatGPT für Erwachsene veröffentlicht würde, wäre das wirklich komisch
    • Zur Erinnerung: Der Valentinstag ist Mitte Februar
  • GPT‑5.2 ist das Standardmodell, also ist es logisch, dass 99,9 % der Nutzer es verwenden

    • Man kann den Standardwert nicht ändern und muss jedes Mal manuell auf 5.1 umstellen
      Das UI-Design ist frustrierend und nervt
    • Nur weil 0,1 % der Nutzer es verwenden, heißt das nicht, dass auch nur 0,1 % der Gespräche darauf entfallen
    • Ich frage mich, welches Modell für normale Nutzer in Web oder App standardmäßig gesetzt ist
    • (halb im Scherz) Ich würde gern sagen: „Denkt denn niemand an die goonettes!“
  • Es ist wirklich gut, dass es so viele Optionen wie Gemini, Claude und ChatGPT gibt

    • Grok ist auch ziemlich ordentlich
    • Stimme zu, Vielfalt bei der Auswahl ist das Beste
  • ChatGPT wird als Forschungsassistent zunehmend weniger nützlich, deshalb bin ich zu Grok und Gemini gewechselt
    Insgesamt bin ich viel zufriedener

    • Die Erfahrungen unterscheiden sich je nach Person enorm
      Ich hatte eher das Gefühl, dass ChatGPT immer besser wurde, während Gemini für mich fast unbrauchbar war
    • Ich habe gesehen, wie Gemini Informationen zu DOI-Artikeln frei erfunden hat
      Sogar die Links wurden falsch zitiert, daher ist es für Forschung schwer vertrauenswürdig
    • Ich frage mich, warum du Claude nicht ausprobiert hast