12 Punkte von xguru 2024-07-19 | 1 Kommentare | Auf WhatsApp teilen
  • Von GPT-4o mini wird erwartet, dass es künstliche Intelligenz deutlich günstiger macht und den Umfang von mit KI entwickelten Anwendungen stark erweitert
  • Es erreichte 82 % bei MMLU und übertrifft derzeit GPT-4 bei den Chat-Präferenzen auf dem LMSYS-Leaderboard
  • Der Preis liegt bei 15 Cent pro 1 Million Eingabe-Token und 60 Cent pro 1 Million Ausgabe-Token, damit ist es 10-mal günstiger als das bisherige Spitzenmodell und mehr als 60 % günstiger als GPT-3.5 Turbo

Hauptfunktionen von GPT-4o mini

  • Kann dank niedriger Kosten und geringer Latenz ein breites Spektrum an Aufgaben ausführen
  • Eignet sich für Anwendungen, die mehrere Modellaufrufe verketten oder parallelisieren, z. B. mehrere API-Aufrufe
  • Eignet sich für Anwendungen, die dem Modell große Mengen an Kontext übergeben, z. B. ganze Codebasen oder Gesprächsverläufe
  • Eignet sich für Anwendungen, die schnell und in Echtzeit Textantworten mit Kunden austauschen, z. B. Kundensupport-Chatbots
  • Unterstützt in der API Text und Vision; künftig sollen Ein- und Ausgaben für Text, Bilder, Video und Audio unterstützt werden
  • Verfügt über ein Kontextfenster von 128K Token, unterstützt bis zu 16K Ausgabe-Token pro Anfrage und besitzt Wissen bis Oktober 2023
  • Dank des verbesserten Tokenizers, den es mit GPT-4o teilt, wird die Verarbeitung nicht englischer Texte noch kosteneffizienter

Starke Leistung von GPT-4o mini

  • GPT-4o mini übertrifft GPT-3.5 Turbo und andere kleine Modelle sowohl bei Textintelligenz als auch bei multimodalem Schlussfolgern
  • Unterstützt die gleiche Sprachabdeckung wie GPT-4o
  • Bietet starke Leistung bei Function Calling, sodass Entwickler Anwendungen bauen können, die Daten aus externen Systemen abrufen oder Aufgaben ausführen
  • Verbesserte Leistung bei langen Kontexten im Vergleich zu GPT-3.5 Turbo
  • Erzielte 82,0 % bei MMLU, 87,0 % bei MGSM, 87,2 % bei HumanEval und 59,4 % bei MMMU und zeigt damit bessere Leistung als andere kleine Modelle

Sicherheitsmaßnahmen

  • Während des Vortrainings werden Informationen gefiltert, die das Modell weder lernen noch ausgeben soll, etwa Hassrede, Inhalte für Erwachsene, Websites, die überwiegend personenbezogene Daten sammeln, Spam usw.
  • Beim Nachtraining werden Techniken wie Reinforcement Learning from Human Feedback (RLHF) eingesetzt, um das Verhalten des Modells an Richtlinien anzupassen und so Genauigkeit und Zuverlässigkeit der Antworten zu verbessern
  • GPT-4o mini hat die gleichen integrierten Sicherheitsmaßnahmen wie GPT-4o
  • Mehr als 70 externe Experten haben GPT-4o getestet, um potenzielle Risiken zu identifizieren; diese wurden adressiert und sollen im GPT-4o System Card sowie im Preparedness Scorecard ausführlich geteilt werden
  • GPT-4o mini ist das erste Modell in der API, das den Instruction-Hierarchy-Ansatz anwendet, um die Widerstandsfähigkeit des Modells gegen Jailbreaks, Prompt Injection und das Extrahieren von System Prompts zu verbessern

Preise und Verfügbarkeit

  • GPT-4o mini ist ab sofort als Text- und Vision-Modell in der Assistants API, der Chat Completions API und der Batch API verfügbar
  • Entwickler zahlen 15 Cent pro 1 Million Eingabe-Token und 60 Cent pro 1 Million Ausgabe-Token
  • In den kommenden Tagen soll Fine-Tuning für GPT-4o mini veröffentlicht werden
  • Nutzer von ChatGPT Free, Plus und Team können ab heute statt GPT-3.5 auf GPT-4o mini zugreifen
  • Enterprise-Nutzer erhalten ab nächster Woche ebenfalls Zugriff

Ausblick

  • Parallel zu den bemerkenswerten Fortschritten bei der KI-Intelligenz werden erhebliche Kostensenkungen erzielt
  • Die Kosten pro Token von GPT-4o mini liegen 99 % unter denen von text-davinci-003, das 2022 eingeführt wurde
  • Es wird eine Zukunft angestrebt, in der Modelle nahtlos in alle Apps und Websites integriert sind
  • GPT-4o mini ebnet Entwicklern den Weg, leistungsstarke KI-Anwendungen effizienter und günstiger zu bauen und zu skalieren
  • Die Zukunft der KI wird zugänglicher, verlässlicher und immer stärker in unsere alltäglichen digitalen Erfahrungen eingebettet

1 Kommentare

 
wedding 2024-07-22

Dann kommt wohl auch noch gpt-4o pro max ultra.