OpenAI stellt GPT-4o mini vor, sein kosteneffizientestes kleines Modell

xguru · 2024-07-19T11:52:11+09:00

Von GPT-4o mini wird erwartet, dass es künstliche Intelligenz deutlich günstiger macht und den Umfang von mit KI entwickelten Anwendungen stark erweitert Es erreichte 82 % bei MMLU und übertrifft derzeit GPT-4 bei den Chat-Präferenzen auf dem LMSYS-Leaderboard Der Preis liegt bei 15 Cent pro 1 Million Eingabe-Token und 60 Cent pro 1 Million Ausgabe-Token, damit ist es 10-mal günstiger als das bisherige Spitzenmodell und mehr als 60 % günstiger als GPT-3.5 Turbo Hauptfunktionen von GPT-4o mini Kann dank niedriger Kosten und geringer Latenz ein breites Spektrum an Aufgaben ausführen Eignet sich für Anwendungen, die mehrere Modellaufrufe verketten oder parallelisieren, z. B. mehrere API-Aufrufe Eignet sich für Anwendungen, die dem Modell große Mengen an Kontext übergeben, z. B. ganze Codebasen oder Gesprächsverläufe Eignet sich für Anwendungen, die schnell und in Echtzeit Textantworten mit Kunden austauschen, z. B. Kundensupport-Chatbots Unterstützt in der API Text und Vision; künftig sollen Ein- und Ausgaben für Text, Bilder, Video und Audio unterstützt werden Verfügt über ein Kontextfenster von 128K Token, unterstützt bis zu 16K Ausgabe-Token pro Anfrage und besitzt Wissen bis Oktober 2023 Dank des verbesserten Tokenizers, den es mit GPT-4o teilt, wird die Verarbeitung nicht englischer Texte noch kosteneffizienter Starke Leistung von GPT-4o mini GPT-4o mini übertrifft GPT-3.5 Turbo und andere kleine Modelle sowohl bei Textintelligenz als auch bei multimodalem Schlussfolgern Unterstützt die gleiche Sprachabdeckung wie GPT-4o Bietet starke Leistung bei Function Calling, sodass Entwickler Anwendungen bauen können, die Daten aus externen Systemen abrufen oder Aufgaben ausführen Verbesserte Leistung bei langen Kontexten im Vergleich zu GPT-3.5 Turbo Erzielte 82,0 % bei MMLU, 87,0 % bei MGSM, 87,2 % bei HumanEval und 59,4 % bei MMMU und zeigt damit bessere Leistung als andere kleine Modelle Sicherheitsmaßnahmen Während des Vortrainings werden Informationen gefiltert, die das Modell weder lernen noch ausgeben soll, etwa Hassrede, Inhalte für Erwachsene, Websites, die überwiegend personenbezogene Daten sammeln, Spam usw. Beim Nachtraining werden Techniken wie Reinforcement Learning from Human Feedback (RLHF) eingesetzt, um das Verhalten des Modells an Richtlinien anzupassen und so Genauigkeit und Zuverlässigkeit der Antworten zu verbessern GPT-4o mini hat die gleichen integrierten Sicherheitsmaßnahmen wie GPT-4o Mehr als 70 externe Experten haben GPT-4o getestet, um potenzielle Risiken zu identifizieren; diese wurden adressiert und sollen im GPT-4o System Card sowie im Preparedness Scorecard ausführlich geteilt werden GPT-4o mini ist das erste Modell in der API, das den Instruction-Hierarchy-Ansatz anwendet, um die Widerstandsfähigkeit des Modells gegen Jailbreaks, Prompt Injection und das Extrahieren von System Prompts zu verbessern Preise und Verfügbarkeit GPT-4o mini ist ab sofort als Text- und Vision-Modell in der Assistants API, der Chat Completions API und der Batch API verfügbar Entwickler zahlen 15 Cent pro 1 Million Eingabe-Token und 60 Cent pro 1 Million Ausgabe-Token In den kommenden Tagen soll Fine-Tuning für GPT-4o mini veröffentlicht werden Nutzer von ChatGPT Free, Plus und Team können ab heute statt GPT-3.5 auf GPT-4o mini zugreifen Enterprise-Nutzer erhalten ab nächster Woche ebenfalls Zugriff Ausblick Parallel zu den bemerkenswerten Fortschritten bei der KI-Intelligenz werden erhebliche Kostensenkungen erzielt Die Kosten pro Token von GPT-4o mini liegen 99 % unter denen von text-davinci-003, das 2022 eingeführt wurde Es wird eine Zukunft angestrebt, in der Modelle nahtlos in alle Apps und Websites integriert sind GPT-4o mini ebnet Entwicklern den Weg, leistungsstarke KI-Anwendungen effizienter und günstiger zu bauen und zu skalieren Die Zukunft der KI wird zugänglicher, verlässlicher und immer stärker in unsere alltäglichen digitalen Erfahrungen eingebettet

(openai.com)

12 Punkte von xguru 2024-07-19 | 1 Kommentare | Auf WhatsApp teilen

Von GPT-4o mini wird erwartet, dass es künstliche Intelligenz deutlich günstiger macht und den Umfang von mit KI entwickelten Anwendungen stark erweitert
Es erreichte 82 % bei MMLU und übertrifft derzeit GPT-4 bei den Chat-Präferenzen auf dem LMSYS-Leaderboard
Der Preis liegt bei 15 Cent pro 1 Million Eingabe-Token und 60 Cent pro 1 Million Ausgabe-Token, damit ist es 10-mal günstiger als das bisherige Spitzenmodell und mehr als 60 % günstiger als GPT-3.5 Turbo

Hauptfunktionen von GPT-4o mini

Kann dank niedriger Kosten und geringer Latenz ein breites Spektrum an Aufgaben ausführen
Eignet sich für Anwendungen, die mehrere Modellaufrufe verketten oder parallelisieren, z. B. mehrere API-Aufrufe
Eignet sich für Anwendungen, die dem Modell große Mengen an Kontext übergeben, z. B. ganze Codebasen oder Gesprächsverläufe
Eignet sich für Anwendungen, die schnell und in Echtzeit Textantworten mit Kunden austauschen, z. B. Kundensupport-Chatbots
Unterstützt in der API Text und Vision; künftig sollen Ein- und Ausgaben für Text, Bilder, Video und Audio unterstützt werden
Verfügt über ein Kontextfenster von 128K Token, unterstützt bis zu 16K Ausgabe-Token pro Anfrage und besitzt Wissen bis Oktober 2023
Dank des verbesserten Tokenizers, den es mit GPT-4o teilt, wird die Verarbeitung nicht englischer Texte noch kosteneffizienter

Starke Leistung von GPT-4o mini

GPT-4o mini übertrifft GPT-3.5 Turbo und andere kleine Modelle sowohl bei Textintelligenz als auch bei multimodalem Schlussfolgern
Unterstützt die gleiche Sprachabdeckung wie GPT-4o
Bietet starke Leistung bei Function Calling, sodass Entwickler Anwendungen bauen können, die Daten aus externen Systemen abrufen oder Aufgaben ausführen
Verbesserte Leistung bei langen Kontexten im Vergleich zu GPT-3.5 Turbo
Erzielte 82,0 % bei MMLU, 87,0 % bei MGSM, 87,2 % bei HumanEval und 59,4 % bei MMMU und zeigt damit bessere Leistung als andere kleine Modelle

Sicherheitsmaßnahmen

Während des Vortrainings werden Informationen gefiltert, die das Modell weder lernen noch ausgeben soll, etwa Hassrede, Inhalte für Erwachsene, Websites, die überwiegend personenbezogene Daten sammeln, Spam usw.
Beim Nachtraining werden Techniken wie Reinforcement Learning from Human Feedback (RLHF) eingesetzt, um das Verhalten des Modells an Richtlinien anzupassen und so Genauigkeit und Zuverlässigkeit der Antworten zu verbessern
GPT-4o mini hat die gleichen integrierten Sicherheitsmaßnahmen wie GPT-4o
Mehr als 70 externe Experten haben GPT-4o getestet, um potenzielle Risiken zu identifizieren; diese wurden adressiert und sollen im GPT-4o System Card sowie im Preparedness Scorecard ausführlich geteilt werden
GPT-4o mini ist das erste Modell in der API, das den Instruction-Hierarchy-Ansatz anwendet, um die Widerstandsfähigkeit des Modells gegen Jailbreaks, Prompt Injection und das Extrahieren von System Prompts zu verbessern

Preise und Verfügbarkeit

GPT-4o mini ist ab sofort als Text- und Vision-Modell in der Assistants API, der Chat Completions API und der Batch API verfügbar
Entwickler zahlen 15 Cent pro 1 Million Eingabe-Token und 60 Cent pro 1 Million Ausgabe-Token
In den kommenden Tagen soll Fine-Tuning für GPT-4o mini veröffentlicht werden
Nutzer von ChatGPT Free, Plus und Team können ab heute statt GPT-3.5 auf GPT-4o mini zugreifen
Enterprise-Nutzer erhalten ab nächster Woche ebenfalls Zugriff

Ausblick

Parallel zu den bemerkenswerten Fortschritten bei der KI-Intelligenz werden erhebliche Kostensenkungen erzielt
Die Kosten pro Token von GPT-4o mini liegen 99 % unter denen von text-davinci-003, das 2022 eingeführt wurde
Es wird eine Zukunft angestrebt, in der Modelle nahtlos in alle Apps und Websites integriert sind
GPT-4o mini ebnet Entwicklern den Weg, leistungsstarke KI-Anwendungen effizienter und günstiger zu bauen und zu skalieren
Die Zukunft der KI wird zugänglicher, verlässlicher und immer stärker in unsere alltäglichen digitalen Erfahrungen eingebettet

1 Kommentare

wedding 2024-07-22

Dann kommt wohl auch noch gpt-4o pro max ultra.