- Mit dem weiteren Fortschritt der AI-Technologie lassen sich zunehmend komplexe und wichtige Probleme lösen, wofür erhebliche Computing-Ressourcen erforderlich sind
- ChatGPT Pro ist ein Tarif für 200 US-Dollar pro Monat, der erweiterten Zugang zu den neuesten Modellen und Tools von OpenAI bietet
- o1: das intelligenteste Modell
- o1-mini, GPT-4o und Advanced Voice sind ebenfalls enthalten
- o1 pro mode: nutzt mehr Computing-Ressourcen, um tiefer nachzudenken und ausgefeiltere Antworten auf komplexe Probleme zu liefern
- Künftig sollen noch leistungsfähigere Produktivitätsfunktionen hinzukommen
- Es wurde für Forschende, Ingenieurinnen und Ingenieure sowie Personen mit forschungsorientierten Aufgaben entwickelt, um die Produktivität zu steigern und dabei zu helfen, an der Spitze der AI-Entwicklung zu stehen
- Der o1 pro mode von ChatGPT Pro ist ein fortschrittliches Modell, das besonders verlässliche Antworten liefert
- Insbesondere in den Bereichen Data Science, Programmierung und juristische Analyse liefert es präzise und umfassende Antworten
- Im Vergleich zu o1 und o1-preview zeigt es bei schwierigen Machine-Learning-Benchmarks in Mathematik, Wissenschaft und Coding eine bessere Leistung
Wichtige Leistungsvergleiche (basierend auf pass@1-Genauigkeit)
- Mathematikwettbewerb (AIME 2024)
- o1-preview: 50
- o1: 78
- o1 pro mode: 86
- Coding-Wettbewerb (Codeforces)
- o1-preview: 62
- o1: 89
- o1 pro mode: 90
- Wissenschaftsfragen auf Promotionsniveau (GPQA Diamond)
- o1-preview: 74
- o1: 76
- o1 pro mode: 79
Höhere Zuverlässigkeit: Bewertung nach „4/4 reliability“
- Einführung eines strengeren Bewertungsmaßstabs: Als gelöst gilt nur, wenn in 4 von 4 Versuchen jedes Mal die richtige Antwort gegeben wurde
Wichtige Leistungsvergleiche (basierend auf 4/4-Zuverlässigkeit)
- Mathematikwettbewerb (AIME 2024)
- o1-preview: 37
- o1: 67
- o1 pro mode: 80
- Coding-Wettbewerb (Codeforces)
- o1-preview: 26
- o1: 64
- o1 pro mode: 75
- Wissenschaftsfragen auf Promotionsniveau (GPQA Diamond)
- o1-preview: 58
- o1: 67
- o1 pro mode: 74
7 Kommentare
Ich habe Pro ausprobiert, aber das kurze Kontextfenster ist ein kritisches Problem. Es kann zwar längere Inhalte schreiben, aber nach einer Weile beginnen die ursprünglich geschriebenen Inhalte oder das Format nach und nach auseinanderzufallen.
OpenAI entfernt sich immer mehr von „open“.
Das ist wohl die Realität.
Ich dachte, die Plus-Abo-Gebühr würde erhöht, weil die Kosten kaum zu stemmen sind, aber stattdessen greifen sie die Sache an, indem sie eine noch teurere Produktlinie neu einführen. Ich nutze es zwar im Alltag wirklich sehr gut, aber ich glaube nicht, dass ich die Pro-Version brauche. Haha
Ich nutze derzeit noch Plus. Seit einiger Zeit habe ich jedoch das Gefühl, dass sich die Ausführung verändert hat, obwohl ich mit derselben Art von Engine dieselbe Art von Prompt verwende. Es wirkt, als würde sie nicht mehr so gut leisten wie früher.
Ich frage mich, ob man nicht die Modelle, die im bisherigen Plus verfügbar sind, absichtlich abschwächt und sie dann stückweise verkauft.
Je teurer etwas wird, desto mehr erwartet man eigentlich Zuverlässigkeit bei der Leistung, aber bei AI-Services gibt es so etwas offenbar nicht. Es sieht gut möglich aus, dass AI denselben Weg geht wie Internetanschlüsse, die eines Tages plötzlich heimlich gedrosselt werden.
Ich nutze auch Plus, aber wie soll man es nennen – den Grundton der Antworten? Es heißt zwar ebenfalls
o1, aber der Gesamteindruck ist im Vergleich zur Preview völlig anders geworden. Ich frage mich inzwischen sogar, ob jemand die Token-Ausgabe drosselt.Dem stimme ich zu. Ich habe ebenfalls das Gefühl, dass die Leistung schwankt, selbst wenn ich dieselbe Version zur gleichen Zeit verwende, ohne dass das gesondert erwähnt wird. Das ist zwar ein etwas anderes Thema, aber auch bei der Aussage, dass bestimmte Dienste keine Informationen sammeln, gibt es letztlich keine Möglichkeit, das zu überprüfen, sodass es am Ende wohl einfach eine Frage des Vertrauens bleibt.
Hacker-News-Kommentare
OpenAI konkurriert zwischen dem Entwicklungstempo von Open-Source-Alternativen und der Notwendigkeit, Umsätze zu erzielen. Ob das gelingt, hängt davon ab, ob große Unternehmen sich für die integrierten und sicheren KI-Lösungen von OpenAI entscheiden. Das ähnelt der IBM-Strategie im Enterprise-Computing.
Es gibt Unzufriedenheit darüber, dass das Kontextfenster der Pro-Version kurz ist. Als Plus-Mitglied hatte man ein längeres Kontextfenster erwartet, doch dazu gibt es überhaupt keine Diskussion. Wettbewerbern wird dringend empfohlen, das Kontextfenster als Unterscheidungsmerkmal zu betrachten.
Der erste Eindruck nach dem Kauf des Pro-Abos ist, dass das neue o1-Pro-Modell ein sehr starker Autor ist. Es verarbeitet lange Prompts und komplexe Datenanalysen gut.
Der Plan für mehr Rechenleistung lässt sich als Preisstrategie mit Lockvogel-Effekt erklären. Durch die Einführung einer teuren Option wirken andere Pläne vernünftiger.
Für Claude Teams werden monatlich 166 Euro gezahlt. Der Grund sind die Projektfunktionen in Kombination mit der Möglichkeit, viele Dateien hochzuladen und Fragen in einem bestimmten Kontext zu stellen. Diese Funktion ist so mächtig, als hätte man Forschende direkt zur Hand.
Bei Anthropic gibt es für deutlich weniger Geld eine bessere Leistung. Die Behauptung, das neue GPT sei Claude zehnmal überlegen, wird skeptisch gesehen.
Es wird bezweifelt, dass OpenAI „allgemeine“ KI erreichen kann, bevor die Investoren ungeduldig werden. Möglicherweise haben sie mit dem Erfolg von ChatGPT angedeutet, dass es für sie einen Weg dorthin gibt.
Die größte Schwierigkeit bei monatlichen Abopreisen für die „unbegrenzte“ Nutzung eines Produkts sind die 1 % der Power-User mit extremer Nutzung. Der Preis von ChatGPT Pro zielt auf Power-User und Unternehmen ab.
Es wurden 4,5 Stunden damit verbracht, komplexe Google-Sheets-Formeln zu schreiben. Wenn der neue ChatGPT-Pro-Modus schneller ist, bringt das beim Zeitersparnis einen großen Vorteil.
Es gibt Fälle, in denen in Interview-Mills Interviews mit dem o1-Modell geführt werden. Bei solchen Anwendungsfällen kann sich die Monatsgebühr von 200 $ günstig anfühlen.