8 Punkte von xguru 2024-09-13 | 4 Kommentare | Auf WhatsApp teilen
  • Neues Reasoning-Modell zur Lösung komplexer Probleme
  • Das Modell wurde darauf trainiert, länger über Probleme nachzudenken, bevor es antwortet
  • Durch das Training verbessert es seinen Denkprozess, probiert verschiedene Strategien aus und lernt, Fehler zu erkennen
  • Bei anspruchsvollen Benchmark-Aufgaben in Physik, Chemie und Biologie zeigt es eine Leistung ähnlich der von Doktoranden
  • Auch in Mathematik und beim Coding erzielt es hervorragende Ergebnisse
    • In der Qualifikationsprüfung zur Internationalen Mathematik-Olympiade (IMO) löste GPT-4o nur 13 %, während das Reasoning-Modell 83 % erreichte
    • Bei Codeforces erreichte seine Coding-Leistung das 89. Perzentil

Sicherheit

  • Es wurde ein neuer Ansatz für Sicherheitstraining entwickelt, damit das Modell Sicherheits- und Alignment-Richtlinien einhält
  • In einem der schwierigsten Jailbreak-Tests erzielte GPT-4o 22 Punkte (von 100), während das o1-preview-Modell 84 Punkte erreichte
  • Sicherheitsarbeit, interne Governance und die Zusammenarbeit mit der Bundesregierung wurden verstärkt
    • Strenge Tests und Evaluierungen mit dem Preparedness Framework
    • Red-Teaming auf höchstem Niveau
    • Prüfprozesse auf Vorstandsebene einschließlich des Safety & Security Committee
  • Vereinbarungen mit den AI Safety Institutes in den USA und im Vereinigten Königreich wurden geschlossen und die Zusammenarbeit aufgenommen

Für wen ist das Modell gedacht

  • Besonders nützlich kann es sein, wenn komplexe Probleme in Bereichen wie Wissenschaft, Coding und Mathematik bearbeitet werden
  • Zum Beispiel
    • können Forschende im Gesundheitswesen Zellsequenzierungsdaten annotieren,
    • Physiker komplexe mathematische Formeln für die Quantenoptik erzeugen und
    • Entwickler es zum Aufbau und zur Ausführung mehrstufiger Workflows nutzen

OpenAI o1-mini

  • Die o1-Serie ist besonders stark darin, komplexen Code präzise zu erzeugen und zu debuggen
  • Um Entwicklern eine effizientere Lösung zu bieten, wurde mit o1-mini auch ein schnelleres und günstigeres Reasoning-Modell veröffentlicht
  • o1-mini ist 80 % günstiger als o1-preview
    • Ein leistungsfähiges und kosteneffizientes Modell für Anwendungen, die Reasoning benötigen, aber kein umfassendes Weltwissen

So verwendet man OpenAI o1

  • ChatGPT-Plus- und Team-Nutzer können ab heute in ChatGPT auf das o1-Modell zugreifen
  • Sowohl o1-preview als auch o1-mini können manuell ausgewählt werden
  • Zum Start gilt ein Limit von 30 Nachrichten pro Woche für o1-preview und 50 Nachrichten pro Woche für o1-mini
  • ChatGPT-Enterprise- und Edu-Nutzer erhalten ab nächster Woche Zugriff auf beide Modelle
  • Entwickler auf API-Nutzungsstufe 5 können ab heute mit beiden Modellen in der API bei einem Rate Limit von 20 RPM mit dem Prototyping beginnen
  • Die API dieser Modelle unterstützt derzeit noch keine Funktionen wie Function Calling, Streaming oder System Messages
  • Es ist geplant, allen ChatGPT-Free-Nutzern Zugriff auf o1-mini zu geben

Nächste Schritte

  • Dies ist eine frühe Preview des Reasoning-Modells für ChatGPT und die API
  • Zusätzlich zu Modell-Updates ist geplant, Funktionen wie Browsing sowie Datei- und Bild-Uploads hinzuzufügen, um es für alle nützlicher zu machen
  • Parallel zur neuen OpenAI-o1-Serie sollen auch die Modelle der GPT-Serie weiterentwickelt und veröffentlicht werden

4 Kommentare

 
dbs0829 2024-09-13

Ich bin gespannt, welche Synergie es mit GitHub Copilot geben wird.

 
wedding 2024-09-13

Ist das die Strawberry, von der man in den Gerüchten gehört hat?

 
brainer 2024-09-13

Stimmt. Altman hat die Person getröstet, die dieses Gerücht verbreitet hat.

 
xguru 2024-09-13

Das dürfte stimmen. Offenbar hat man einfach die Versionsnummer 1 gewählt, um den Fokus auf Schlussfolgerung zu legen.