- Von GPT-4o mini wird erwartet, dass es künstliche Intelligenz deutlich günstiger macht und den Umfang von mit KI entwickelten Anwendungen stark erweitert
- Es erreichte 82 % bei MMLU und übertrifft derzeit GPT-4 bei den Chat-Präferenzen auf dem LMSYS-Leaderboard
- Der Preis liegt bei 15 Cent pro 1 Million Eingabe-Token und 60 Cent pro 1 Million Ausgabe-Token, damit ist es 10-mal günstiger als das bisherige Spitzenmodell und mehr als 60 % günstiger als GPT-3.5 Turbo
Hauptfunktionen von GPT-4o mini
- Kann dank niedriger Kosten und geringer Latenz ein breites Spektrum an Aufgaben ausführen
- Eignet sich für Anwendungen, die mehrere Modellaufrufe verketten oder parallelisieren, z. B. mehrere API-Aufrufe
- Eignet sich für Anwendungen, die dem Modell große Mengen an Kontext übergeben, z. B. ganze Codebasen oder Gesprächsverläufe
- Eignet sich für Anwendungen, die schnell und in Echtzeit Textantworten mit Kunden austauschen, z. B. Kundensupport-Chatbots
- Unterstützt in der API Text und Vision; künftig sollen Ein- und Ausgaben für Text, Bilder, Video und Audio unterstützt werden
- Verfügt über ein Kontextfenster von 128K Token, unterstützt bis zu 16K Ausgabe-Token pro Anfrage und besitzt Wissen bis Oktober 2023
- Dank des verbesserten Tokenizers, den es mit GPT-4o teilt, wird die Verarbeitung nicht englischer Texte noch kosteneffizienter
Starke Leistung von GPT-4o mini
- GPT-4o mini übertrifft GPT-3.5 Turbo und andere kleine Modelle sowohl bei Textintelligenz als auch bei multimodalem Schlussfolgern
- Unterstützt die gleiche Sprachabdeckung wie GPT-4o
- Bietet starke Leistung bei Function Calling, sodass Entwickler Anwendungen bauen können, die Daten aus externen Systemen abrufen oder Aufgaben ausführen
- Verbesserte Leistung bei langen Kontexten im Vergleich zu GPT-3.5 Turbo
- Erzielte 82,0 % bei MMLU, 87,0 % bei MGSM, 87,2 % bei HumanEval und 59,4 % bei MMMU und zeigt damit bessere Leistung als andere kleine Modelle
Sicherheitsmaßnahmen
- Während des Vortrainings werden Informationen gefiltert, die das Modell weder lernen noch ausgeben soll, etwa Hassrede, Inhalte für Erwachsene, Websites, die überwiegend personenbezogene Daten sammeln, Spam usw.
- Beim Nachtraining werden Techniken wie Reinforcement Learning from Human Feedback (RLHF) eingesetzt, um das Verhalten des Modells an Richtlinien anzupassen und so Genauigkeit und Zuverlässigkeit der Antworten zu verbessern
- GPT-4o mini hat die gleichen integrierten Sicherheitsmaßnahmen wie GPT-4o
- Mehr als 70 externe Experten haben GPT-4o getestet, um potenzielle Risiken zu identifizieren; diese wurden adressiert und sollen im GPT-4o System Card sowie im Preparedness Scorecard ausführlich geteilt werden
- GPT-4o mini ist das erste Modell in der API, das den Instruction-Hierarchy-Ansatz anwendet, um die Widerstandsfähigkeit des Modells gegen Jailbreaks, Prompt Injection und das Extrahieren von System Prompts zu verbessern
Preise und Verfügbarkeit
- GPT-4o mini ist ab sofort als Text- und Vision-Modell in der Assistants API, der Chat Completions API und der Batch API verfügbar
- Entwickler zahlen 15 Cent pro 1 Million Eingabe-Token und 60 Cent pro 1 Million Ausgabe-Token
- In den kommenden Tagen soll Fine-Tuning für GPT-4o mini veröffentlicht werden
- Nutzer von ChatGPT Free, Plus und Team können ab heute statt GPT-3.5 auf GPT-4o mini zugreifen
- Enterprise-Nutzer erhalten ab nächster Woche ebenfalls Zugriff
Ausblick
- Parallel zu den bemerkenswerten Fortschritten bei der KI-Intelligenz werden erhebliche Kostensenkungen erzielt
- Die Kosten pro Token von GPT-4o mini liegen 99 % unter denen von text-davinci-003, das 2022 eingeführt wurde
- Es wird eine Zukunft angestrebt, in der Modelle nahtlos in alle Apps und Websites integriert sind
- GPT-4o mini ebnet Entwicklern den Weg, leistungsstarke KI-Anwendungen effizienter und günstiger zu bauen und zu skalieren
- Die Zukunft der KI wird zugänglicher, verlässlicher und immer stärker in unsere alltäglichen digitalen Erfahrungen eingebettet
1 Kommentare
Dann kommt wohl auch noch gpt-4o pro max ultra.