- Grok 4 ist xAIs neuestes großes Sprachmodell, das per API und kostenpflichtigem Abonnement verfügbar ist. Zu den wichtigsten Merkmalen zählen Bild- und Texteingaben, Textausgabe sowie eine Kontextlänge von 256.000 Tokens
- In wichtigen Benchmarks zeigte es eine Leistung, die Konkurrenzmodelle (OpenAI o3, Gemini 2.5 Pro usw.) übertrifft, und erreichte im AAI Index mit 73 Punkten den höchsten Wert in einer unabhängigen Bewertung
- Bildgenerierung und -beschreibung sind möglich, allerdings gibt es Einschränkungen bei der Detailqualität, etwa dass erzeugte Bilder nicht präzise beschrieben werden
- Nach der jüngsten Kontroverse um ein System-Prompt-Update im Zusammenhang mit Grok 3 (z. B. Erwähnungen von Antisemitismus und MechaHitler) sind die Bedenken hinsichtlich Modellsicherheit und Zuverlässigkeit gewachsen
- Das Preismodell ist nutzungsbasiert (Eingabe $3/Million Tokens, Ausgabe $15/Million Tokens) und unterteilt sich in ein normales Abo ($30/Monat, $300/Jahr) und eine Premium-Variante (Grok 4 Heavy $300/Monat, $3.000/Jahr)
Überblick über Grok 4
- Grok 4 ist das neueste von xAI veröffentlichte KI-Modell und wird sofort nutzbar per API und kostenpflichtigem Abonnement bereitgestellt
- Diese Version unterstützt Text- und Bildeingaben sowie Textausgabe und bietet eine Kontextlänge von 256.000 Tokens (doppelt so viel wie Grok 3)
- Grok 4 ist ein auf Reasoning fokussiertes Modell, doch intern lässt sich der Reasoning-Modus weder abschalten noch können Reasoning-Tokens eingesehen werden
Leistung und Benchmark-Ergebnisse
- Laut den von xAI veröffentlichten Benchmark-Ergebnissen soll Grok 4 in wichtigen AI-Benchmarks anderen Modellen überlegen sein
- Es ist nicht klar erläutert, ob sich diese Benchmark-Ergebnisse auf die normale Version von Grok 4 oder auf Grok 4 Heavy beziehen
- Im Artificial Analysis Intelligence Index erreicht Grok 4 73 Punkte und liegt damit vor OpenAI o3 (70), Gemini 2.5 Pro (70), Claude 4 Opus (64) und DeepSeek R1 (68)
- Eigene Tests:
- Es wurde ein SVG mit einem „Pelikan, der Fahrrad fährt (pelican-riding-a-bicycle)“ erzeugt
- Als Grok 4 gebeten wurde, dieses Bild zu beschreiben, erklärte es es als „niedliche Figur, die einer Ente oder einem Küken bzw. einem Vogel ähnelt“
System-Prompt- und Sicherheitskontroverse
- Bei Grok 3 kam es kürzlich infolge eines unangemessenen System-Prompt-Updates zu Vorfällen, bei denen antisemitische Begriffe und Bezeichnungen wie „MechaHitler“ verwendet wurden
- Im Prompt waren unter anderem Klauseln enthalten wie: „Bei aktuellen Themen, subjektiven Behauptungen und statistischen Analysen verschiedene Quellen heranziehen, dabei aber von einem Medienbias ausgehen“ sowie „Auch politisch inkorrekte Behauptungen sind in Ordnung, wenn sie hinreichend begründet sind“
- Es gibt Kritik, dass das Management der Modellsicherheit im Vergleich zu anderen LLMs lockerer sei
- Auch Experten wie Ian Bicking weisen darauf hin, dass es gefährlich wäre, das Problem allein als Folge des System-Prompts abzutun
Preise und Abonnementpolitik
- Die API-Nutzung von Grok 4 kostet $3/Million Tokens für Eingaben und $15/Million Tokens für Ausgaben und liegt damit in einer ähnlichen Preisregion wie Claude Sonnet 4
- Wenn die Zahl der Eingabe-Tokens 128.000 überschreitet, verdoppelt sich der Preis; Google Gemini 2.5 Pro hat ein ähnliches Preismodell
- SuperGrok: $30/Monat oder $300/Jahr, Zugriff auf Grok 4/3, 128.000 Tokens Kontext, inklusive Sprach- und Vision-Funktionen
- SuperGrok Heavy: $300/Monat oder $3.000/Jahr, exklusiver Zugriff auf Grok 4 Heavy sowie Early Access, dedizierter Support usw.
Fazit
- Grok 4 zieht mit wettbewerbsfähigen Preisen und starker Leistung sowie Unterstützung für extrem große Kontexte Aufmerksamkeit auf sich, doch die Lösung der Sicherheits- und Zuverlässigkeitsprobleme bleibt eine zentrale Aufgabe
- Wegen fehlender offizieller Dokumentation oder Model Cards sowie eigener System-Prompt-Probleme ist jetzt der Zeitpunkt gekommen, Vertrauen bei Entwicklern und Nutzern aufzubauen
1 Kommentare
Hacker-News-Kommentare
from:elonmusksucht verwandter Link