- Neues Reasoning-Modell zur Lösung komplexer Probleme
- Das Modell wurde darauf trainiert, länger über Probleme nachzudenken, bevor es antwortet
- Durch das Training verbessert es seinen Denkprozess, probiert verschiedene Strategien aus und lernt, Fehler zu erkennen
- Bei anspruchsvollen Benchmark-Aufgaben in Physik, Chemie und Biologie zeigt es eine Leistung ähnlich der von Doktoranden
- Auch in Mathematik und beim Coding erzielt es hervorragende Ergebnisse
- In der Qualifikationsprüfung zur Internationalen Mathematik-Olympiade (IMO) löste GPT-4o nur 13 %, während das Reasoning-Modell 83 % erreichte
- Bei Codeforces erreichte seine Coding-Leistung das 89. Perzentil
Sicherheit
- Es wurde ein neuer Ansatz für Sicherheitstraining entwickelt, damit das Modell Sicherheits- und Alignment-Richtlinien einhält
- In einem der schwierigsten Jailbreak-Tests erzielte GPT-4o 22 Punkte (von 100), während das o1-preview-Modell 84 Punkte erreichte
- Sicherheitsarbeit, interne Governance und die Zusammenarbeit mit der Bundesregierung wurden verstärkt
- Strenge Tests und Evaluierungen mit dem Preparedness Framework
- Red-Teaming auf höchstem Niveau
- Prüfprozesse auf Vorstandsebene einschließlich des Safety & Security Committee
- Vereinbarungen mit den AI Safety Institutes in den USA und im Vereinigten Königreich wurden geschlossen und die Zusammenarbeit aufgenommen
Für wen ist das Modell gedacht
- Besonders nützlich kann es sein, wenn komplexe Probleme in Bereichen wie Wissenschaft, Coding und Mathematik bearbeitet werden
- Zum Beispiel
- können Forschende im Gesundheitswesen Zellsequenzierungsdaten annotieren,
- Physiker komplexe mathematische Formeln für die Quantenoptik erzeugen und
- Entwickler es zum Aufbau und zur Ausführung mehrstufiger Workflows nutzen
OpenAI o1-mini
- Die o1-Serie ist besonders stark darin, komplexen Code präzise zu erzeugen und zu debuggen
- Um Entwicklern eine effizientere Lösung zu bieten, wurde mit o1-mini auch ein schnelleres und günstigeres Reasoning-Modell veröffentlicht
- o1-mini ist 80 % günstiger als o1-preview
- Ein leistungsfähiges und kosteneffizientes Modell für Anwendungen, die Reasoning benötigen, aber kein umfassendes Weltwissen
So verwendet man OpenAI o1
- ChatGPT-Plus- und Team-Nutzer können ab heute in ChatGPT auf das o1-Modell zugreifen
- Sowohl o1-preview als auch o1-mini können manuell ausgewählt werden
- Zum Start gilt ein Limit von 30 Nachrichten pro Woche für o1-preview und 50 Nachrichten pro Woche für o1-mini
- ChatGPT-Enterprise- und Edu-Nutzer erhalten ab nächster Woche Zugriff auf beide Modelle
- Entwickler auf API-Nutzungsstufe 5 können ab heute mit beiden Modellen in der API bei einem Rate Limit von 20 RPM mit dem Prototyping beginnen
- Die API dieser Modelle unterstützt derzeit noch keine Funktionen wie Function Calling, Streaming oder System Messages
- Es ist geplant, allen ChatGPT-Free-Nutzern Zugriff auf o1-mini zu geben
Nächste Schritte
- Dies ist eine frühe Preview des Reasoning-Modells für ChatGPT und die API
- Zusätzlich zu Modell-Updates ist geplant, Funktionen wie Browsing sowie Datei- und Bild-Uploads hinzuzufügen, um es für alle nützlicher zu machen
- Parallel zur neuen OpenAI-o1-Serie sollen auch die Modelle der GPT-Serie weiterentwickelt und veröffentlicht werden
4 Kommentare
Ich bin gespannt, welche Synergie es mit GitHub Copilot geben wird.
Ist das die Strawberry, von der man in den Gerüchten gehört hat?
Stimmt. Altman hat die Person getröstet, die dieses Gerücht verbreitet hat.
Das dürfte stimmen. Offenbar hat man einfach die Versionsnummer 1 gewählt, um den Fokus auf Schlussfolgerung zu legen.