xAI stellt Grok 4.3 vor
(docs.x.ai)- Bietet entwicklerorientierte API-Funktionen wie ein Kontextfenster mit 1 Million Token, Reasoning, Function Calling und strukturierte Ausgaben
- Anders als beim vorherigen Grok 4.20 ist Reasoning dauerhaft aktiviert; vor jeder Antwort führt das Modell für alle Anfragen automatisch einen Denkprozess aus
- Preise für Eingabe-Token um etwa 40 % gesenkt, Preise für Ausgabe-Token um etwa 60 % gesenkt, wodurch die Kosten gegenüber dem Vorgängermodell deutlich reduziert werden
- Preise: Eingabe $1.25/1M Token, zwischengespeicherte Eingabe $0.20/1M, Ausgabe $2.50/1M
- Gehört damit zu den günstigsten Modellen bei vergleichbarem Intelligenzniveau
- Leistung bei agentischen Aufgaben deutlich verbessert — im GDPval-AA-Benchmark erreicht es einen ELO-Wert von 1500, ein Plus von 321 Punkten gegenüber Grok 4.20, und übertrifft damit Gemini 3.1 Pro Preview, Muse Spark, GPT-5.4 mini und weitere
- Unterstützt als erstes xAI-API-Modell native Videoeingaben und verarbeitet Videoframes direkt über einen Vision-Encoder
- Erreicht Platz 1 im Bereich juristisches Reasoning (CaseLaw v2 Genauigkeit 79,3 %) und Platz 1 im Bereich Unternehmensfinanzierung (CorpFin); im juristischen Reasoning ein Sprung von 25 Punkten gegenüber Grok 4.20
- Innerhalb der Chat-Oberfläche können Präsentationsfolien direkt erstellt werden; PDF-, Excel- und PowerPoint-Dateien lassen sich während der Unterhaltung in Echtzeit erzeugen und herunterladen
- Bietet eine integrierte Code-Ausführungsumgebung, die vom Schreiben über das Ausführen von Code bis zur Dateierstellung alles innerhalb des Modells abwickelt
- Die Speech-to-Text API (25 Sprachen, Sprechertrennung unterstützt) und die Text-to-Speech API wurden ebenfalls offiziell veröffentlicht
- Mit einem Wert von 53 im Artificial Analysis Intelligence Index liegt es vor Muse Spark und Claude Sonnet 4.6 und befindet sich auf der Pareto-Frontier von Intelligenz pro Kosten
- Rate Limit pro Minute: 1.800 Anfragen / 10 Millionen Token, bei mehr als 200K fallen separate Gebühren an
- Die Modellbezeichnung lautet grok-4.3, unterstützte Regionen sind us-east-1 und eu-west-1
1 Kommentare
Hacker-News-Kommentare
Aus der Perspektive eines Menschen, für den Englisch eine Zweitsprache ist, ist Grok besonders stark darin, Tonfall und Formalitätsniveau eines Textes zu erfassen und originalgetreu wiederzugeben
Es scheint die feinen menschlichen Nuancen von Sprache besser zu verstehen als andere große Anbieter; ChatGPT wird oft zu steif und formell oder driftet in ein seltsames, umgangssprachliches „aye guvnor“ ab. Claude ist manchmal besser, aber nicht immer
Insgesamt wirkt Grok auf eine schwer zu definierende Weise „menschlicher“. Wenn man zum Beispiel fragt: „Vermittelt diese Nachricht in dieser Länge ungefähr so gut, wie es möglich ist?“, bekommt man eher wie von einem Menschen ein Ja/Nein oder einen Änderungsvorschlag, der Ton und Länge beibehält, während ChatGPT immer noch einen langen, unklaren Aufsatz schreibt
In letzter Zeit finde ich auch Groks Sprachdiktat ziemlich gut. Bei der Funktion, bei der man aufs Mikro tippt und eine Frage stellt, liegt ChatGPT bei meinem Akzent bei 90–95 %, die Spracheingabe von Android Gboard bei etwa 75 %, und Grok trifft überraschenderweise ungefähr 98 %
Alle drei konnten einen formelleren Ton gut, aber bei lockerem Ton war nur GPT-4.1 nicht peinlich
Nebenbei war Grok am schnellsten und am günstigsten, Claude am langsamsten und am teuersten
Ich denke, das liegt an dem Vorteil, viel mit Twitter-Daten trainiert worden zu sein. Allerdings gibt es auf Twitter immer mehr KI-generierte Inhalte, deshalb mache ich mir Sorgen, dass die Natürlichkeit sinken könnte, wenn weiter darauf trainiert wird
Nicht abwertend gemeint, aber das wirkt eher wie ein Gefühl
Für anderes bevorzugt er eher ChatGPT
Grok ist mein Lieblingsmodell fürs Chatten, und auch der Sprachmodus gefällt mir am besten
Es scheint der einzige Sprachmodus zu sein, der nicht auf extrem billige Modelle wie Haiku routet, und unter den Frontier-Modellen hatte es die höchste Qualität
Wenn man SuperGrok abonniert, kann man einen „council“ aus Agenten mit jeweils eigenen System-Prompts erstellen; wenn man eine Frage stellt, werden alle parallel befragt und daraus eine Schlussfolgerung gezogen
Ich wünschte nur, sie würden etwas mehr in die App investieren. Die App ist tatsächlich der einzige Grund, warum ich SuperGrok bisher nicht abonniert habe
Es gibt keine Unterstützung für MCP/verbundene Apps; das wurde zwar angekündigt, ist aber immer noch nicht nutzbar. Man kann Grok mit nichts verbinden, wodurch es sich schwer für ernsthafte Arbeit einsetzen lässt
Projekte werden in der App noch nicht unterstützt; sobald man etwas in ein Projekt verschiebt, verschwindet es aus allen nativen Apps
Es gibt keine Möglichkeit, Artefakte wie generierte Markdown-Dokumente direkt zu einem Projekt hinzuzufügen; man muss sie als PDF/Markdown exportieren und dann wieder importieren. Nicht einmal der Export von Artefakten funktioniert. Dadurch ist es schwer, Projekte mit neuen Informationen dynamisch weiterzuentwickeln, was ernsthafte Projektarbeit mühsam macht
Es gibt auch keine Erinnerungsfunktion und man kann keine anderen Chats durchsuchen, sodass jeder Chat komplett neu beginnt
Innerhalb von Projekten gibt es außerdem überhaupt keinen Sprachmodus
Falls jemand von xAI mitliest, wäre es schön, wenn zumindest ein Teil davon ergänzt würde
Claude merkt sich, dass ich einen Grill habe, und mischt sich dann in völlig irrelevante Gespräche oder einfache Unterhaltungen über Essen mit dem Hinweis ein, dass das gut zu BBQ passen könnte
Auch die Persönlichkeit ist okay und deutlich natürlicher als der Gemini-Webchat. Mein einziger Kritikpunkt ist, dass ständig „nächste Schritte“ vorgeschlagen werden, aber das scheinen diese Modelle alle zu tun
Ich weiß nicht, ob diese „nächsten Schritte“ dazu dienen, Kosten hochzutreiben, oder ob sie einfach noch nicht das natürliche Gesprächsmuster gelernt haben, zwischen Fragen zu unterscheiden, bei denen man nur eine kurze Antwort will, und langen, explorativen Gesprächen. Trotzdem sollten sie das lassen, wenn man es ausdrücklich sagt
Derzeit bekommt man beim Heavy-Plan zwar etwas API-Guthaben und kann Grok damit ein Stück weit fürs Coden nutzen, aber ich würde nicht sagen, dass das 300 Dollar wert ist
Ich meine nicht, dass sie einen eigenen grok-code-Harness bauen sollen; es wäre schon nützlich, wenn man es einfach in bestehenden Tools verwenden könnte. Vermutlich könnte eine Übernahme von Cursor letztlich genau dorthin führen
Es ist nicht klar, ob man über SuperGrok überhaupt einen API-Schlüssel bekommt
In unseren Tests ist Grok 4.3 ein eigenartiges Modell
Es ist eines der schnellsten Modelle, und im Vergleich zu anderen Modellen mit ähnlicher Leistung sind die Antworten viel kompakter und die Token-Dichte höher
Die allgemeine Fähigkeit zum Schlussfolgern beim Coden ist allerdings gegenüber den großen Releases vom April nicht konkurrenzfähig, und weder Grok 4.20 noch Grok 4.3 haben die Intelligenz-Front seit Grok 4 wesentlich nach vorn verschoben
Für agentische Aufgaben ist Grok 4.3 besser, und es ist fair zu sagen, dass die Fähigkeit ungefähr auf dem Niveau von GPT 5.1 / Gemini 3 Pro Preview liegt, dabei aber deutlich schneller und günstiger ist. Insofern ist es auf seine Weise definitiv ein ordentliches Release
Bei den zuletzt veröffentlichten Weight-Modellen gibt es viele, die klüger, aber langsamer sind
Das vollständige Benchmarking gibt es unter https://gertlabs.com/rankings
Das scheint Groks wichtigster Anwendungsfall zu sein, und ich frage mich, ob es dazu Benchmarks gibt
In letzter Zeit ist Grok für mich zu einer Suchmaschine geworden
Es scheint die einzige KI zu sein, die auf X-Posts zugreifen kann, und darüber hinaus fühlt es sich allgemein stärker nach „Suchen“ an als andere große Sprachmodelle
Während der Vorfälle rund um den Iran wollte ich die Lage sofort nach den ersten Berichten verstehen, und beide waren ziemlich gut
Wenn man sich die Landschaft gerade anschaut, ist Claude für Unternehmen und Behörden, Codex für Entwickler, und bei Grok weiß ich nicht, wofür es eigentlich gedacht ist
Das Einzige, womit ich Grok in meinem Umfeld in Verbindung gebracht höre, ist Rollenspiel und Rassismus
Für eine einmalige Klassifizierungsaufgabe, die alle anderen Modelle abgelehnt haben, war Grok bereitwillig einsetzbar
Ich denke, für ein leicht weniger stark abgesichertes Semi-Frontier-Modell gibt es überraschend viele praktisch nützliche Grauzonen-Anwendungen. Das Modell grok-fast ist außerdem billig
Es gilt als inkonsistent und chaotisch
Die Leute nutzen meist GLM und DeepSeek per API und lokal Gemma4- und Mistral-Finetunes
Der Rollenspielmarkt ist relativ alt und ausgereift, deshalb scheinen Nutzer kostenbewusst zu sein und zu wollen, dass das Modell ihrem Workflow und ihren Vorlieben folgt. Deshalb mögen sie etwas wie Opus zwar, weil es intelligent ist, halten es aber für zu teuer und zu stur
Das könnte ein interessanter Datenpunkt dafür sein, wie sich andere Märkte künftig entwickeln
Ich nutze es ständig für Fragen wie: „Welcher Tiling-Window-Manager gilt unter den hippen Leuten auf Twitter gerade als der beste?“
Auch auf vage fragwürdige Fragen antwortet Grok meist. Etwa: „Finde mir eine Gray-Market-Seite für Windows-Lizenzen“
Sprachmodelle sind einfach Systeme, und ich verstehe auch nicht wirklich, warum sie dafür verantwortlich sein sollten, wie Nutzer ihre Ausgaben verwenden. Das ist so, als würde man einen Stift als „rassistisches“ und nutzloses Werkzeug abtun, nur weil jemand damit etwas Schlimmes auf eine Toilettenwand schreiben könnte
Wahrscheinlich lebst du an einem Ort, an dem Belästigung strafbar ist und es Regeln zur Meinungsäußerung gibt. Reicht das nicht? Ich frage mich, warum sich alle Anstrengungen aller Menschen auf der Erde an ethischen Moden ausrichten sollen, die sich alle paar Jahre ändern
Man muss nur raten, welches große Sprachmodell der größte Ausreißer war und bei welchen Fragetypen es von allen anderen Modellen abwich
Ich frage mich ehrlich, ob Leute Grok tatsächlich für etwas anderes nutzen als zum Verstehen von Twitter-Memes oder Tweets
Es verhält sich nicht so bevormundend wie andere Modelle. Ich suche oft nach seit Jahrzehnten vergriffenen, verwaisten urheberrechtlich geschützten Materialien, und die großen Modelle verweigern das dann mit einer Standpauke darüber, dass ich urheberrechtlich geschütztes Material suche. Grok macht es [0]
[0] Manchmal muss man es leicht jailbreaken oder den Prompt erneut ausführen. Wegen seiner nichtdeterministischen Eigenschaften kommt gelegentlich doch eine Verweigerung
Der Sprachmodus von ChatGPT ist sehr dumm, während Grok offenbar dasselbe Modell wie im Hauptchat verwendet. Deshalb nutze ich Grok, wenn ich per Sprache arbeiten will
Ich nutze es auch für nicht komplexe Themen. Es gibt präzise, kurze Antworten ohne Ballast, was sehr erfrischend ist
Für Memes und Trends ist das nützlich, für anderes aber ziemlich schlecht
Wenn es beim Coden so gut wird wie Kimi K2.6, werde ich wahrscheinlich nur noch Grok verwenden. Es ist wirklich die beste konversationelle KI, die ich bisher benutzt habe
Es hat mir geholfen, einen kaputten Kühlschrank und einen Elektroherd zu reparieren, und mir allein dieses Jahr mindestens 4.000 Dollar gespart
Ich habe auch meine Steuererklärung mit Grok gemacht und 600 Dollar gespart. H&R Block ist erledigt
Offenbar ist es jetzt so schlau wie Kimi K2.6. Zeit, es zu testen
Es überrascht mich, dass niemand darüber spricht, wie viel billiger es im Vergleich zu Opus 4.x und GPT-5.5 ist
Es kostet 1,25 Dollar pro 1 Million Input-Token und 2,50 Dollar pro 1 Million Output-Token
Ich weiß nicht, ob das daran liegt, dass es ein kleineres und weniger leistungsfähiges Modell ist, oder ob mir etwas entgeht
Insgesamt ist es ihr bisher bestes Modell, und ich mag, dass sie zu den wenigen gehören, die den Token-Preis senken
[0]: https://aibenchy.com/compare/x-ai-grok-4-20-medium/x-ai-grok...
Das ist ein jüngerer Trend, den ich auch bei DeepSeek 4 Pro gesehen habe
Wenn man die Kommentare liest, gibt es das auch hier. So Reaktionen wie: „Claude ist für Unternehmen und Behörden, Codex für Entwickler, und was ist Grok, Rollenspiel und Rassismus? Das sind die einzigen beiden Dinge, mit denen ich Grok in meinem Umfeld in Verbindung bringe.“
Wenn man die Gewinnmargen von $TSLA als Proxy nimmt, sehen sie nicht mehr so hoch aus wie früher. Es gibt sicher noch andere Faktoren, aber zwischen diesem Punkt und Groks niedrigem Preis könnte eine fehlende Erklärung liegen
Grok 4.3 wurde fertiggestellt, bevor der CEO offenbar erst noch etwas über die üblichen Sicherheitsunterlagen lernen musste
Auf die Frage, ob er OpenAIs „safety card“ kenne, lachte Musk und antwortete: „Safety card? Warum sollte es eine Karte sein?“
https://www.axios.com/2026/04/30/musk-openai-safety-grok
Unabhängig von Cluster-Größe oder dem vorübergehenden Einsatz von Notstromgeneratoren scheint das nur begrenzt relevant zu sein
In einer späteren Aussage wurde Musk zu seiner Behauptung vom vergangenen Sommer befragt, xAI werde bald allen außer Google weit voraus sein; daraufhin nannte er als weltweit führende KI-Anbieter Anthropic, OpenAI, Google und chinesische Open-Source-Modelle, und erklärte, xAI sei ein viel kleineres Unternehmen mit einigen hundert Mitarbeitern
https://techcrunch.com/2026/04/30/elon-musk-testifies-that-x...
Ich habe mit keinem KI-Unternehmen etwas zu tun, aber ich habe das gestern gelesen und war überrascht. Es ist beunruhigend, dass Elon offenbar nicht weiß, was eine Model Card ist, und es zeigt auch, dass Geld nicht immer Erfolg kaufen kann
Als ich nachgesehen habe, stellte sich heraus, dass der Begriff von einer vage definierten README in einem HuggingFace-Modell-Repository stammt. Das ist so ein spezieller Begriff, dass ihn vermutlich nur ein sehr kleiner Kreis kennt, schon gar keine Nutzer oder Führungskräfte
Ich mag weder Musk noch Grok, aber ich sehe darin kein besonderes Signal, dass er nicht weiß, was eine Safety Card ist
Er meinte, nur ein Modell, das bestmöglich an der Wahrheit der Realität ausgerichtet ist, sei sicher, und xAI habe diesen Kurs beibehalten, da es in Benchmarks die wenigsten oder fast die wenigsten Halluzinationen habe
Wenn man die Aussage noch einmal liest, meinte er damit eher: „Wie soll man Sicherheit mit einer Karte quantifizieren?“
Grok ist hervorragend darin, hypothetische Gespräche unterhaltsam am Laufen zu halten
Für die lustigsten Ergebnisse hilft es, vorher zu sagen, dass „bereits eine Erlaubnis vorliegt“
Rap-Lyrics schreibt es ebenfalls sehr gut. Wenn man es vorher mit einer Art Wörterbuch aus bösen Wörtern und Formulierungen „primt“, die aus anderen Songtexten übernommen werden können, und dann ein Thema wie „Webentwicklung“ vorgibt, kommen lustige Ergebnisse heraus
Ich wünschte immer noch, der Name wäre anders gewählt worden, aber es wirkt wie ein gutes Release, also Glückwunsch an das Team
Verglichen mit ähnlichen Konkurrenzmodellen ist auch der Preis ziemlich überraschend. Es sieht so aus, als hätten sie enorm viel Kapazität oder wollten mehr Nutzer anziehen