OpenAI stellt GPT-4.5 vor

xguru · 2025-02-28T09:19:15+09:00

GPT-4.5 ist OpenAIs neuestes Modell und eine Version mit verbesserter Skalierbarkeit im Pre-Training und Post-Training Durch die Ausweitung des unüberwachten Lernens werden Mustererkennung und kreative Einsichten gestärkt Natürlichere Gespräche sind möglich, die Benutzerabsicht wird besser verstanden und die emotionale Intelligenz (EQ) wurde verbessert Nützlich für verschiedene Aufgaben wie Schreiben, Programmierung und Problemlösung Es wird erwartet, dass die Halluzinationsrate sinkt Es wird als Research Preview bereitgestellt, mit dem Ziel, die Stärken und Grenzen des Modells zu erkunden und verschiedene Use Cases zu sammeln Ausweitung des unüberwachten Lernens Für den Fortschritt von KI werden zwei Achsen erweitert: unüberwachtes Lernen und Reasoning Stärkeres Reasoning: Das Modell wurde darauf trainiert, systematisch zu denken, um komplexe STEM-Probleme zu lösen Modelle wie OpenAI o1 und OpenAI o3-mini treiben diesen Ansatz voran Ausweitung des unüberwachten Lernens: Mehr Daten erhöhen die Intuition des Modells und die Genauigkeit seines Weltwissens GPT-4.5 wurde auf einem Microsoft Azure AI Supercomputer trainiert und verfügt über breiteres Wissen sowie tieferes Verständnis Dadurch treten Halluzinationen seltener auf, und das Modell liefert zu verschiedensten Themen verlässlichere Ergebnisse Erweiterung des GPT-Paradigmas GPT-4.5 verfügt über mehr Wissen als frühere Modelle Es liefert tiefere Einsichten zu historischen Fragen wie dem Ursprung der Sprache Auf Fragen wie „Was war die erste Sprache?“: Wahrscheinlich gab es nicht die eine erste Sprache Es wird vermutet, dass Sprache vor mehr als 100.000 Jahren in Afrika entstanden ist Proto-Sprachen könnten sich aus Gesten, Lauten und Signalen entwickelt haben Da es keine Aufzeichnungen gibt, lässt sich der genaue Ursprung der Sprache nicht bestimmen So kann GPT-4.5 auch in Linguistik und Geschichte fundierte Antworten liefern Tieferes Weltwissen In der SimpleQA-Bewertung erzielte GPT-4.5 eine höhere Genauigkeit als andere Modelle Vergleich der Accuracy: GPT-4.5: 62.5% GPT-4o: 38.2% OpenAI o1: 47% OpenAI o3-mini: 15% Vergleich der Hallucination Rate (niedriger ist besser): GPT-4.5: 37.1% GPT-4o: 61.8% OpenAI o1: 44% OpenAI o3-mini: 80.3% GPT-4.5 hält bei Fragen, die Faktenprüfung erfordern, eine höhere Genauigkeit und senkt die Halluzinationsrate Training für die Zusammenarbeit mit Menschen GPT-4.5 wurde darauf trainiert, menschliche Anforderungen und Absichten besser zu verstehen Es interpretiert Benutzerabsichten präziser und ermöglicht natürlichere Gespräche Gegenüber früheren Modellen wurde die emotionale Intelligenz (EQ) verbessert, sodass subtile Nuancen besser verstanden werden Bei Schreib- und Designaufgaben zeigt es starke kreative Intuition und ein gutes ästhetisches Gespür Vergleichsbewertung (Win-rate vs GPT-4o) Kreative Aufgaben: 56.8% Fachliche Fragen: 63.2% Alltägliche Fragen: 57.0% GPT-4.5 arbeitet auf natürliche Weise mit Menschen zusammen und erkennt die Benutzerabsicht im Gespräch genauer Ausblick: stärkere Reasoning-Fähigkeiten GPT-4.5 ist kein Modell, das vor der Antwort logisch nachdenkt Es verfolgt einen anderen Ansatz als reasoning-zentrierte Modelle wie OpenAI o1 und OpenAI o3-mini Für künftige Modelle wird erwartet, dass die Kombination aus Pre-Training und Reasoning zum Kern wird Mehr Sicherheit GPT-4.5 wurde mit neuen Überwachungsmethoden trainiert, darunter bestehendes SFT (Supervised Fine-Tuning) und RLHF (Reinforcement Learning from Human Feedback) Vor dem Deployment wurden Sicherheitstests durchgeführt, um potenzielle Risiken zu bewerten Eine System Card mit den Evaluationsergebnissen wurde veröffentlicht, um Forschung und Feedback zu fördern So verwendet man GPT-4.5 in ChatGPT Ab heute können ChatGPT-Pro-Nutzer GPT-4.5 im Web, auf Mobilgeräten und am Desktop auswählen Nächste Woche ist die Bereitstellung für Plus- und Team-Nutzer geplant In der darauffolgenden Woche folgt die Bereitstellung für Enterprise- und Edu-Nutzer Wichtige Funktionen: Suche nach aktuellen Informationen möglich Unterstützung für Datei- und Bild-Uploads Schreib- und Coding-Aufgaben mit Canvas möglich Sprachmodus, Video und Screen-Sharing werden jedoch nicht unterstützt So verwendet man GPT-4.5 in der API Für Entwickler wird es über die Chat Completions API, Assistants API und Batch API bereitgestellt Wichtige Funktionen: Function Calling Structured Outputs Streaming System Messages Vision-Unterstützung per Bildeingabe Anwendungsfälle für Entwickler: Applikationen, bei denen emotionale Intelligenz und Kreativität wichtig sind (z. B. Schreibassistenten, Lern-Coaching, Brainstorming) Komplexe Code-Aufgaben (z. B. mehrstufige Coding-Workflows, Automatisierung) Aspekte zur API-Bereitstellung: GPT-4.5 ist ein rechenintensives und kostspieliges Modell und ersetzt daher GPT-4o nicht Langfristig wird noch geprüft, ob es weiterhin über die API angeboten wird; Nutzerfeedback ist wichtig Fazit GPT-4.5 ist ein Modell, das die Grenzen des unüberwachten Lernens erweitert und kreative sowie neue Fähigkeiten erkunden kann Es lotet neue Möglichkeiten der KI-Technologie aus, und es werden innovative Anwendungsfälle der Nutzer erwartet.

(openai.com)

4 Punkte von xguru 2025-02-28 | 4 Kommentare | Auf WhatsApp teilen

GPT-4.5 ist OpenAIs neuestes Modell und eine Version mit verbesserter Skalierbarkeit im Pre-Training und Post-Training
Durch die Ausweitung des unüberwachten Lernens werden Mustererkennung und kreative Einsichten gestärkt
Natürlichere Gespräche sind möglich, die Benutzerabsicht wird besser verstanden und die emotionale Intelligenz (EQ) wurde verbessert
Nützlich für verschiedene Aufgaben wie Schreiben, Programmierung und Problemlösung
Es wird erwartet, dass die Halluzinationsrate sinkt
Es wird als Research Preview bereitgestellt, mit dem Ziel, die Stärken und Grenzen des Modells zu erkunden und verschiedene Use Cases zu sammeln

Ausweitung des unüberwachten Lernens

Für den Fortschritt von KI werden zwei Achsen erweitert: unüberwachtes Lernen und Reasoning
- Stärkeres Reasoning: Das Modell wurde darauf trainiert, systematisch zu denken, um komplexe STEM-Probleme zu lösen
  - Modelle wie OpenAI o1 und OpenAI o3-mini treiben diesen Ansatz voran
- Ausweitung des unüberwachten Lernens: Mehr Daten erhöhen die Intuition des Modells und die Genauigkeit seines Weltwissens
GPT-4.5 wurde auf einem Microsoft Azure AI Supercomputer trainiert und verfügt über breiteres Wissen sowie tieferes Verständnis
- Dadurch treten Halluzinationen seltener auf, und das Modell liefert zu verschiedensten Themen verlässlichere Ergebnisse

Erweiterung des GPT-Paradigmas

GPT-4.5 verfügt über mehr Wissen als frühere Modelle
- Es liefert tiefere Einsichten zu historischen Fragen wie dem Ursprung der Sprache
- Auf Fragen wie „Was war die erste Sprache?“:
  - Wahrscheinlich gab es nicht die eine erste Sprache
  - Es wird vermutet, dass Sprache vor mehr als 100.000 Jahren in Afrika entstanden ist
  - Proto-Sprachen könnten sich aus Gesten, Lauten und Signalen entwickelt haben
  - Da es keine Aufzeichnungen gibt, lässt sich der genaue Ursprung der Sprache nicht bestimmen
So kann GPT-4.5 auch in Linguistik und Geschichte fundierte Antworten liefern

Tieferes Weltwissen

In der SimpleQA-Bewertung erzielte GPT-4.5 eine höhere Genauigkeit als andere Modelle
- Vergleich der Accuracy:
  - GPT-4.5: 62.5%
  - GPT-4o: 38.2%
  - OpenAI o1: 47%
  - OpenAI o3-mini: 15%
- Vergleich der Hallucination Rate (niedriger ist besser):
  - GPT-4.5: 37.1%
  - GPT-4o: 61.8%
  - OpenAI o1: 44%
  - OpenAI o3-mini: 80.3%
GPT-4.5 hält bei Fragen, die Faktenprüfung erfordern, eine höhere Genauigkeit und senkt die Halluzinationsrate

Training für die Zusammenarbeit mit Menschen

GPT-4.5 wurde darauf trainiert, menschliche Anforderungen und Absichten besser zu verstehen
- Es interpretiert Benutzerabsichten präziser und ermöglicht natürlichere Gespräche
- Gegenüber früheren Modellen wurde die emotionale Intelligenz (EQ) verbessert, sodass subtile Nuancen besser verstanden werden
- Bei Schreib- und Designaufgaben zeigt es starke kreative Intuition und ein gutes ästhetisches Gespür
Vergleichsbewertung (Win-rate vs GPT-4o)
- Kreative Aufgaben: 56.8%
- Fachliche Fragen: 63.2%
- Alltägliche Fragen: 57.0%
GPT-4.5 arbeitet auf natürliche Weise mit Menschen zusammen und erkennt die Benutzerabsicht im Gespräch genauer

Ausblick: stärkere Reasoning-Fähigkeiten

GPT-4.5 ist kein Modell, das vor der Antwort logisch nachdenkt
Es verfolgt einen anderen Ansatz als reasoning-zentrierte Modelle wie OpenAI o1 und OpenAI o3-mini
Für künftige Modelle wird erwartet, dass die Kombination aus Pre-Training und Reasoning zum Kern wird

Mehr Sicherheit

GPT-4.5 wurde mit neuen Überwachungsmethoden trainiert, darunter bestehendes SFT (Supervised Fine-Tuning) und RLHF (Reinforcement Learning from Human Feedback)
Vor dem Deployment wurden Sicherheitstests durchgeführt, um potenzielle Risiken zu bewerten
Eine System Card mit den Evaluationsergebnissen wurde veröffentlicht, um Forschung und Feedback zu fördern

So verwendet man GPT-4.5 in ChatGPT

Ab heute können ChatGPT-Pro-Nutzer GPT-4.5 im Web, auf Mobilgeräten und am Desktop auswählen
Nächste Woche ist die Bereitstellung für Plus- und Team-Nutzer geplant
In der darauffolgenden Woche folgt die Bereitstellung für Enterprise- und Edu-Nutzer
Wichtige Funktionen:
- Suche nach aktuellen Informationen möglich
- Unterstützung für Datei- und Bild-Uploads
- Schreib- und Coding-Aufgaben mit Canvas möglich
- Sprachmodus, Video und Screen-Sharing werden jedoch nicht unterstützt

So verwendet man GPT-4.5 in der API

Für Entwickler wird es über die Chat Completions API, Assistants API und Batch API bereitgestellt
Wichtige Funktionen:
- Function Calling
- Structured Outputs
- Streaming
- System Messages
- Vision-Unterstützung per Bildeingabe
Anwendungsfälle für Entwickler:
- Applikationen, bei denen emotionale Intelligenz und Kreativität wichtig sind (z. B. Schreibassistenten, Lern-Coaching, Brainstorming)
- Komplexe Code-Aufgaben (z. B. mehrstufige Coding-Workflows, Automatisierung)
Aspekte zur API-Bereitstellung:
- GPT-4.5 ist ein rechenintensives und kostspieliges Modell und ersetzt daher GPT-4o nicht
- Langfristig wird noch geprüft, ob es weiterhin über die API angeboten wird; Nutzerfeedback ist wichtig

Fazit

GPT-4.5 ist ein Modell, das die Grenzen des unüberwachten Lernens erweitert und kreative sowie neue Fähigkeiten erkunden kann
Es lotet neue Möglichkeiten der KI-Technologie aus, und es werden innovative Anwendungsfälle der Nutzer erwartet.

4 Kommentare

GN⁺ 2025-02-28

Hacker-News-Kommentare

GPT 4.5 ist sehr teuer
- Eingabe: $75.00 pro 1 Million Token
- Zwischengespeicherte Eingabe: $37.50 pro 1 Million Token
- Ausgabe: $150.00 pro 1 Million Token
- Im Vergleich zu GPT 4o ist der Preisunterschied groß
- GPT-4.5 ist ein sehr großes und rechenintensives Modell; es wird geprüft, ob es langfristig über die API angeboten wird
- Nutzerfeedback ist wichtig
Eindrücke von der Nutzung von GPT-4.5
- Sehr langsam, für Echtzeit-Interaktion nicht geeignet
- Der Schreibstil wurde verbessert, wirkt lockerer und zugänglicher
- Beim Vergleich von Buchentwürfen ist der Unterschied zwischen GPT4o und GPT4.5 deutlich sichtbar
Fokus auf emotionale Intelligenz (EQ)
- Es ist eine Tendenz erkennbar, sich in einen „freundlichen KI-Freund“ zu verwandeln
- Anthropic und Grok bewegen sich ebenfalls in diese Richtung
- Hoffentlich zeigt sich dieses Verhalten nicht auch in API-Antworten
Enttäuschung über den Blogbeitrag und die Livestream-Demo
- Das neue Modell ist nicht beeindruckend
- Es wirkt, als könnte es für OpenAI schwierig werden, der Konkurrenz voraus zu bleiben
- Der sehr hohe Preis ist überraschend
Unterschiedliche Ansätze von OpenAI und Anthropic
- Anthropic glaubt, dass ein einzelnes Paradigma (Reasoning) für alle Anwendungsfälle geeignet sein könnte
- OpenAI glaubt, dass ein Ensemble von Modellen mit unterschiedlichen Fähigkeiten nötig ist
- GPT 4.5 ist so groß, dass es mehr faktische Daten speichern kann
Leistung von GPT-4.5 im Kagi-LLM-Benchmark
- Trotz des hohen Preises und der geringen Geschwindigkeit ist die Leistung stark
- Bei einigen Aufgaben gibt es aber weiterhin Schwächen
Wie man GPT-4.5 über die API nutzt
- Kann mit dem Tool uvx ausgeführt werden
- Ein API-Key muss gesetzt werden
Vergleich der Coding-Leistung
- ChatGPT 4.5 ist beim Coding etwas besser als ChatGPT 4o
- Anthropic Claude 3.7 zeigt bessere Leistung
Verständnis für OpenAIs Versuch
- GPT 4.5 war ein wichtiger Versuch, die Scaling Laws des Pretrainings zu erforschen
- Ein Geschenk als Beitrag zur Wissenschaft

xguru 2025-02-28

Preis von GPT-4.5 (pro 1 Mio. Tokens)

$75 pro Eingabe
$37,50 für zwischengespeicherte Eingaben
$150 pro Ausgabe
Vergleicht man das mit dem Preis von 4o, ist die Eingabe 30-mal und die Ausgabe 15-mal teurer.

Die Leistung scheint sich allerdings nicht in diesem Maß verbessert zu haben, daher gibt es wohl viel Unzufriedenheit.

Wenn man GPT-4.5 in Cursor verwendet, soll es auch in Fällen effizient funktionieren, in denen andere Modelle scheitern.
Natürlich ist es so teuer, dass man nutzungsbasiert bezahlen muss. Die Reaktion darauf: „Bei komplexem Coding gehe ich ja bankrott.“
https://x.com/cursor_ai/status/1895210110714290302

bearmett 2025-02-28

Beim Blick auf die Preise von Claude Code hatte ich, glaube ich, einen ähnlichen Gedanken. Wenn man Angestellter ist und die Kosten den Stundenlohn übersteigen, ist das dann nicht quasi der Ruin? 😵‍💫

botplaysdice 2025-02-28

Irgendwie ist das vielleicht sogar beruhigend. Je nach Modellpreis steigt oder fällt wohl auch unser eigener Marktwert ...;;;