4 Punkte von xguru 2025-02-28 | 4 Kommentare | Auf WhatsApp teilen
  • GPT-4.5 ist OpenAIs neuestes Modell und eine Version mit verbesserter Skalierbarkeit im Pre-Training und Post-Training
  • Durch die Ausweitung des unüberwachten Lernens werden Mustererkennung und kreative Einsichten gestärkt
  • Natürlichere Gespräche sind möglich, die Benutzerabsicht wird besser verstanden und die emotionale Intelligenz (EQ) wurde verbessert
  • Nützlich für verschiedene Aufgaben wie Schreiben, Programmierung und Problemlösung
  • Es wird erwartet, dass die Halluzinationsrate sinkt
  • Es wird als Research Preview bereitgestellt, mit dem Ziel, die Stärken und Grenzen des Modells zu erkunden und verschiedene Use Cases zu sammeln

Ausweitung des unüberwachten Lernens

  • Für den Fortschritt von KI werden zwei Achsen erweitert: unüberwachtes Lernen und Reasoning
    • Stärkeres Reasoning: Das Modell wurde darauf trainiert, systematisch zu denken, um komplexe STEM-Probleme zu lösen
      • Modelle wie OpenAI o1 und OpenAI o3-mini treiben diesen Ansatz voran
    • Ausweitung des unüberwachten Lernens: Mehr Daten erhöhen die Intuition des Modells und die Genauigkeit seines Weltwissens
  • GPT-4.5 wurde auf einem Microsoft Azure AI Supercomputer trainiert und verfügt über breiteres Wissen sowie tieferes Verständnis
    • Dadurch treten Halluzinationen seltener auf, und das Modell liefert zu verschiedensten Themen verlässlichere Ergebnisse

Erweiterung des GPT-Paradigmas

  • GPT-4.5 verfügt über mehr Wissen als frühere Modelle
    • Es liefert tiefere Einsichten zu historischen Fragen wie dem Ursprung der Sprache
    • Auf Fragen wie „Was war die erste Sprache?“:
      • Wahrscheinlich gab es nicht die eine erste Sprache
      • Es wird vermutet, dass Sprache vor mehr als 100.000 Jahren in Afrika entstanden ist
      • Proto-Sprachen könnten sich aus Gesten, Lauten und Signalen entwickelt haben
      • Da es keine Aufzeichnungen gibt, lässt sich der genaue Ursprung der Sprache nicht bestimmen
  • So kann GPT-4.5 auch in Linguistik und Geschichte fundierte Antworten liefern

Tieferes Weltwissen

  • In der SimpleQA-Bewertung erzielte GPT-4.5 eine höhere Genauigkeit als andere Modelle
    • Vergleich der Accuracy:
      • GPT-4.5: 62.5%
      • GPT-4o: 38.2%
      • OpenAI o1: 47%
      • OpenAI o3-mini: 15%
    • Vergleich der Hallucination Rate (niedriger ist besser):
      • GPT-4.5: 37.1%
      • GPT-4o: 61.8%
      • OpenAI o1: 44%
      • OpenAI o3-mini: 80.3%
  • GPT-4.5 hält bei Fragen, die Faktenprüfung erfordern, eine höhere Genauigkeit und senkt die Halluzinationsrate

Training für die Zusammenarbeit mit Menschen

  • GPT-4.5 wurde darauf trainiert, menschliche Anforderungen und Absichten besser zu verstehen
    • Es interpretiert Benutzerabsichten präziser und ermöglicht natürlichere Gespräche
    • Gegenüber früheren Modellen wurde die emotionale Intelligenz (EQ) verbessert, sodass subtile Nuancen besser verstanden werden
    • Bei Schreib- und Designaufgaben zeigt es starke kreative Intuition und ein gutes ästhetisches Gespür
  • Vergleichsbewertung (Win-rate vs GPT-4o)
    • Kreative Aufgaben: 56.8%
    • Fachliche Fragen: 63.2%
    • Alltägliche Fragen: 57.0%
  • GPT-4.5 arbeitet auf natürliche Weise mit Menschen zusammen und erkennt die Benutzerabsicht im Gespräch genauer

Ausblick: stärkere Reasoning-Fähigkeiten

  • GPT-4.5 ist kein Modell, das vor der Antwort logisch nachdenkt
  • Es verfolgt einen anderen Ansatz als reasoning-zentrierte Modelle wie OpenAI o1 und OpenAI o3-mini
  • Für künftige Modelle wird erwartet, dass die Kombination aus Pre-Training und Reasoning zum Kern wird

Mehr Sicherheit

  • GPT-4.5 wurde mit neuen Überwachungsmethoden trainiert, darunter bestehendes SFT (Supervised Fine-Tuning) und RLHF (Reinforcement Learning from Human Feedback)
  • Vor dem Deployment wurden Sicherheitstests durchgeführt, um potenzielle Risiken zu bewerten
  • Eine System Card mit den Evaluationsergebnissen wurde veröffentlicht, um Forschung und Feedback zu fördern

So verwendet man GPT-4.5 in ChatGPT

  • Ab heute können ChatGPT-Pro-Nutzer GPT-4.5 im Web, auf Mobilgeräten und am Desktop auswählen
  • Nächste Woche ist die Bereitstellung für Plus- und Team-Nutzer geplant
  • In der darauffolgenden Woche folgt die Bereitstellung für Enterprise- und Edu-Nutzer
  • Wichtige Funktionen:
    • Suche nach aktuellen Informationen möglich
    • Unterstützung für Datei- und Bild-Uploads
    • Schreib- und Coding-Aufgaben mit Canvas möglich
    • Sprachmodus, Video und Screen-Sharing werden jedoch nicht unterstützt

So verwendet man GPT-4.5 in der API

  • Für Entwickler wird es über die Chat Completions API, Assistants API und Batch API bereitgestellt
  • Wichtige Funktionen:
    • Function Calling
    • Structured Outputs
    • Streaming
    • System Messages
    • Vision-Unterstützung per Bildeingabe
  • Anwendungsfälle für Entwickler:
    • Applikationen, bei denen emotionale Intelligenz und Kreativität wichtig sind (z. B. Schreibassistenten, Lern-Coaching, Brainstorming)
    • Komplexe Code-Aufgaben (z. B. mehrstufige Coding-Workflows, Automatisierung)
  • Aspekte zur API-Bereitstellung:
    • GPT-4.5 ist ein rechenintensives und kostspieliges Modell und ersetzt daher GPT-4o nicht
    • Langfristig wird noch geprüft, ob es weiterhin über die API angeboten wird; Nutzerfeedback ist wichtig

Fazit

  • GPT-4.5 ist ein Modell, das die Grenzen des unüberwachten Lernens erweitert und kreative sowie neue Fähigkeiten erkunden kann
  • Es lotet neue Möglichkeiten der KI-Technologie aus, und es werden innovative Anwendungsfälle der Nutzer erwartet.

4 Kommentare

 
GN⁺ 2025-02-28

Hacker-News-Kommentare

  • GPT 4.5 ist sehr teuer

    • Eingabe: $75.00 pro 1 Million Token
    • Zwischengespeicherte Eingabe: $37.50 pro 1 Million Token
    • Ausgabe: $150.00 pro 1 Million Token
    • Im Vergleich zu GPT 4o ist der Preisunterschied groß
    • GPT-4.5 ist ein sehr großes und rechenintensives Modell; es wird geprüft, ob es langfristig über die API angeboten wird
    • Nutzerfeedback ist wichtig
  • Eindrücke von der Nutzung von GPT-4.5

    • Sehr langsam, für Echtzeit-Interaktion nicht geeignet
    • Der Schreibstil wurde verbessert, wirkt lockerer und zugänglicher
    • Beim Vergleich von Buchentwürfen ist der Unterschied zwischen GPT4o und GPT4.5 deutlich sichtbar
  • Fokus auf emotionale Intelligenz (EQ)

    • Es ist eine Tendenz erkennbar, sich in einen „freundlichen KI-Freund“ zu verwandeln
    • Anthropic und Grok bewegen sich ebenfalls in diese Richtung
    • Hoffentlich zeigt sich dieses Verhalten nicht auch in API-Antworten
  • Enttäuschung über den Blogbeitrag und die Livestream-Demo

    • Das neue Modell ist nicht beeindruckend
    • Es wirkt, als könnte es für OpenAI schwierig werden, der Konkurrenz voraus zu bleiben
    • Der sehr hohe Preis ist überraschend
  • Unterschiedliche Ansätze von OpenAI und Anthropic

    • Anthropic glaubt, dass ein einzelnes Paradigma (Reasoning) für alle Anwendungsfälle geeignet sein könnte
    • OpenAI glaubt, dass ein Ensemble von Modellen mit unterschiedlichen Fähigkeiten nötig ist
    • GPT 4.5 ist so groß, dass es mehr faktische Daten speichern kann
  • Leistung von GPT-4.5 im Kagi-LLM-Benchmark

    • Trotz des hohen Preises und der geringen Geschwindigkeit ist die Leistung stark
    • Bei einigen Aufgaben gibt es aber weiterhin Schwächen
  • Wie man GPT-4.5 über die API nutzt

    • Kann mit dem Tool uvx ausgeführt werden
    • Ein API-Key muss gesetzt werden
  • Vergleich der Coding-Leistung

    • ChatGPT 4.5 ist beim Coding etwas besser als ChatGPT 4o
    • Anthropic Claude 3.7 zeigt bessere Leistung
  • Verständnis für OpenAIs Versuch

    • GPT 4.5 war ein wichtiger Versuch, die Scaling Laws des Pretrainings zu erforschen
    • Ein Geschenk als Beitrag zur Wissenschaft
 
xguru 2025-02-28

Preis von GPT-4.5 (pro 1 Mio. Tokens)

  • $75 pro Eingabe
  • $37,50 für zwischengespeicherte Eingaben
  • $150 pro Ausgabe
    Vergleicht man das mit dem Preis von 4o, ist die Eingabe 30-mal und die Ausgabe 15-mal teurer.

Die Leistung scheint sich allerdings nicht in diesem Maß verbessert zu haben, daher gibt es wohl viel Unzufriedenheit.

Wenn man GPT-4.5 in Cursor verwendet, soll es auch in Fällen effizient funktionieren, in denen andere Modelle scheitern.
Natürlich ist es so teuer, dass man nutzungsbasiert bezahlen muss. Die Reaktion darauf: „Bei komplexem Coding gehe ich ja bankrott.“
https://x.com/cursor_ai/status/1895210110714290302

 
bearmett 2025-02-28

Beim Blick auf die Preise von Claude Code hatte ich, glaube ich, einen ähnlichen Gedanken. Wenn man Angestellter ist und die Kosten den Stundenlohn übersteigen, ist das dann nicht quasi der Ruin? 😵‍💫

 
botplaysdice 2025-02-28

Irgendwie ist das vielleicht sogar beruhigend. Je nach Modellpreis steigt oder fällt wohl auch unser eigener Marktwert ...;;;