OpenAI veröffentlicht Preview des o1-Modells, das länger nachdenkt und dann antwortet

xguru · 2024-09-13T08:50:46+09:00

Neues Reasoning-Modell zur Lösung komplexer Probleme Das Modell wurde darauf trainiert, länger über Probleme nachzudenken, bevor es antwortet Durch das Training verbessert es seinen Denkprozess, probiert verschiedene Strategien aus und lernt, Fehler zu erkennen Bei anspruchsvollen Benchmark-Aufgaben in Physik, Chemie und Biologie zeigt es eine Leistung ähnlich der von Doktoranden Auch in Mathematik und beim Coding erzielt es hervorragende Ergebnisse In der Qualifikationsprüfung zur Internationalen Mathematik-Olympiade (IMO) löste GPT-4o nur 13 %, während das Reasoning-Modell 83 % erreichte Bei Codeforces erreichte seine Coding-Leistung das 89. Perzentil Sicherheit Es wurde ein neuer Ansatz für Sicherheitstraining entwickelt, damit das Modell Sicherheits- und Alignment-Richtlinien einhält In einem der schwierigsten Jailbreak-Tests erzielte GPT-4o 22 Punkte (von 100), während das o1-preview-Modell 84 Punkte erreichte Sicherheitsarbeit, interne Governance und die Zusammenarbeit mit der Bundesregierung wurden verstärkt Strenge Tests und Evaluierungen mit dem Preparedness Framework Red-Teaming auf höchstem Niveau Prüfprozesse auf Vorstandsebene einschließlich des Safety & Security Committee Vereinbarungen mit den AI Safety Institutes in den USA und im Vereinigten Königreich wurden geschlossen und die Zusammenarbeit aufgenommen Für wen ist das Modell gedacht Besonders nützlich kann es sein, wenn komplexe Probleme in Bereichen wie Wissenschaft, Coding und Mathematik bearbeitet werden Zum Beispiel können Forschende im Gesundheitswesen Zellsequenzierungsdaten annotieren, Physiker komplexe mathematische Formeln für die Quantenoptik erzeugen und Entwickler es zum Aufbau und zur Ausführung mehrstufiger Workflows nutzen OpenAI o1-mini Die o1-Serie ist besonders stark darin, komplexen Code präzise zu erzeugen und zu debuggen Um Entwicklern eine effizientere Lösung zu bieten, wurde mit o1-mini auch ein schnelleres und günstigeres Reasoning-Modell veröffentlicht o1-mini ist 80 % günstiger als o1-preview Ein leistungsfähiges und kosteneffizientes Modell für Anwendungen, die Reasoning benötigen, aber kein umfassendes Weltwissen So verwendet man OpenAI o1 ChatGPT-Plus- und Team-Nutzer können ab heute in ChatGPT auf das o1-Modell zugreifen Sowohl o1-preview als auch o1-mini können manuell ausgewählt werden Zum Start gilt ein Limit von 30 Nachrichten pro Woche für o1-preview und 50 Nachrichten pro Woche für o1-mini ChatGPT-Enterprise- und Edu-Nutzer erhalten ab nächster Woche Zugriff auf beide Modelle Entwickler auf API-Nutzungsstufe 5 können ab heute mit beiden Modellen in der API bei einem Rate Limit von 20 RPM mit dem Prototyping beginnen Die API dieser Modelle unterstützt derzeit noch keine Funktionen wie Function Calling, Streaming oder System Messages Es ist geplant, allen ChatGPT-Free-Nutzern Zugriff auf o1-mini zu geben Nächste Schritte Dies ist eine frühe Preview des Reasoning-Modells für ChatGPT und die API Zusätzlich zu Modell-Updates ist geplant, Funktionen wie Browsing sowie Datei- und Bild-Uploads hinzuzufügen, um es für alle nützlicher zu machen Parallel zur neuen OpenAI-o1-Serie sollen auch die Modelle der GPT-Serie weiterentwickelt und veröffentlicht werden

(openai.com)

8 Punkte von xguru 2024-09-13 | 4 Kommentare | Auf WhatsApp teilen

Neues Reasoning-Modell zur Lösung komplexer Probleme
Das Modell wurde darauf trainiert, länger über Probleme nachzudenken, bevor es antwortet
Durch das Training verbessert es seinen Denkprozess, probiert verschiedene Strategien aus und lernt, Fehler zu erkennen
Bei anspruchsvollen Benchmark-Aufgaben in Physik, Chemie und Biologie zeigt es eine Leistung ähnlich der von Doktoranden
Auch in Mathematik und beim Coding erzielt es hervorragende Ergebnisse
- In der Qualifikationsprüfung zur Internationalen Mathematik-Olympiade (IMO) löste GPT-4o nur 13 %, während das Reasoning-Modell 83 % erreichte
- Bei Codeforces erreichte seine Coding-Leistung das 89. Perzentil

Sicherheit

Es wurde ein neuer Ansatz für Sicherheitstraining entwickelt, damit das Modell Sicherheits- und Alignment-Richtlinien einhält
In einem der schwierigsten Jailbreak-Tests erzielte GPT-4o 22 Punkte (von 100), während das o1-preview-Modell 84 Punkte erreichte
Sicherheitsarbeit, interne Governance und die Zusammenarbeit mit der Bundesregierung wurden verstärkt
- Strenge Tests und Evaluierungen mit dem Preparedness Framework
- Red-Teaming auf höchstem Niveau
- Prüfprozesse auf Vorstandsebene einschließlich des Safety & Security Committee
Vereinbarungen mit den AI Safety Institutes in den USA und im Vereinigten Königreich wurden geschlossen und die Zusammenarbeit aufgenommen

Für wen ist das Modell gedacht

Besonders nützlich kann es sein, wenn komplexe Probleme in Bereichen wie Wissenschaft, Coding und Mathematik bearbeitet werden
Zum Beispiel
- können Forschende im Gesundheitswesen Zellsequenzierungsdaten annotieren,
- Physiker komplexe mathematische Formeln für die Quantenoptik erzeugen und
- Entwickler es zum Aufbau und zur Ausführung mehrstufiger Workflows nutzen

OpenAI o1-mini

Die o1-Serie ist besonders stark darin, komplexen Code präzise zu erzeugen und zu debuggen
Um Entwicklern eine effizientere Lösung zu bieten, wurde mit o1-mini auch ein schnelleres und günstigeres Reasoning-Modell veröffentlicht
o1-mini ist 80 % günstiger als o1-preview
- Ein leistungsfähiges und kosteneffizientes Modell für Anwendungen, die Reasoning benötigen, aber kein umfassendes Weltwissen

So verwendet man OpenAI o1

ChatGPT-Plus- und Team-Nutzer können ab heute in ChatGPT auf das o1-Modell zugreifen
Sowohl o1-preview als auch o1-mini können manuell ausgewählt werden
Zum Start gilt ein Limit von 30 Nachrichten pro Woche für o1-preview und 50 Nachrichten pro Woche für o1-mini
ChatGPT-Enterprise- und Edu-Nutzer erhalten ab nächster Woche Zugriff auf beide Modelle
Entwickler auf API-Nutzungsstufe 5 können ab heute mit beiden Modellen in der API bei einem Rate Limit von 20 RPM mit dem Prototyping beginnen
Die API dieser Modelle unterstützt derzeit noch keine Funktionen wie Function Calling, Streaming oder System Messages
Es ist geplant, allen ChatGPT-Free-Nutzern Zugriff auf o1-mini zu geben

Nächste Schritte

Dies ist eine frühe Preview des Reasoning-Modells für ChatGPT und die API
Zusätzlich zu Modell-Updates ist geplant, Funktionen wie Browsing sowie Datei- und Bild-Uploads hinzuzufügen, um es für alle nützlicher zu machen
Parallel zur neuen OpenAI-o1-Serie sollen auch die Modelle der GPT-Serie weiterentwickelt und veröffentlicht werden

4 Kommentare

dbs0829 2024-09-13

Ich bin gespannt, welche Synergie es mit GitHub Copilot geben wird.

wedding 2024-09-13

Ist das die Strawberry, von der man in den Gerüchten gehört hat?

brainer 2024-09-13

Stimmt. Altman hat die Person getröstet, die dieses Gerücht verbreitet hat.

xguru 2024-09-13

Das dürfte stimmen. Offenbar hat man einfach die Versionsnummer 1 gewählt, um den Fokus auf Schlussfolgerung zu legen.