- Die Modelle Grok-2 und Grok-2 mini wurden für Grok-Nutzer auf der X-Plattform veröffentlicht
- Grok-2 verfügt gegenüber dem vorherigen Modell Grok-1.5 über deutlich verbesserte Fähigkeiten beim Chatten, Codieren und Schlussfolgern
- Eine frühe Version von Grok-2, die unter dem Namen
sus-column-r auf dem LMSYS-Leaderboard getestet wurde, zeigte bessere Leistung als Claude 3.5 Sonnet und GPT-4-Turbo
Grok-2-Sprachmodell und Chat-Funktionen
- Eine frühe Version von Grok-2 wurde unter dem Namen
sus-column-r bei der LMSYS Chatbot Arena eingereicht, einem bekannten Benchmark-Werkzeug für LLM-Wettbewerbe
- Beim gesamten Elo-Score des Modells übertraf es Claude und GPT-4
Benchmarks
- Das Modell Grok-2 wurde in einer Reihe akademischer Benchmarks für Schlussfolgern, Leseverständnis, Mathematik, Wissenschaft und Codierung bewertet
- Grok-2 und Grok-2 mini zeigen im Vergleich zum früheren Modell Grok-1.5 deutliche Verbesserungen
- In Bereichen wie wissenschaftlichem Wissen auf Graduiertenniveau (GPQA), Allgemeinwissen (MMLU, MMLU-Pro) und Mathematik-Olympiade-Aufgaben (MATH) erreichte es wettbewerbsfähige Leistungen gegenüber anderen State-of-the-Art-Modellen
- Grok-2 zeigt State-of-the-Art-Leistung bei visuellem mathematischem Schlussfolgern (MathVista) und dokumentenbasiertem Question Answering (DocVQA)
Grok auf X mit Echtzeitinformationen erleben
- Grok auf der X-Plattform wurde kontinuierlich verbessert
- Nutzer von X Premium und Premium+ können auf zwei neue Modelle zugreifen: Grok-2 und Grok-2 mini
- Grok-2 ist über den Grok-Tab in der X-App zugänglich und ein State-of-the-Art-AI-Assistent mit fortgeschrittenen Fähigkeiten sowohl beim Text- als auch beim visuellen Verständnis
- Grok-2 mini ist ein kleines, aber leistungsfähiges Modell, das ein Gleichgewicht zwischen Geschwindigkeit und Antwortqualität bietet
- In Zusammenarbeit mit Black Forest Labs wird das Modell FLUX.1 erprobt und die Funktionalität von Grok auf X erweitert
Mit Grok über die Enterprise API entwickeln
- Entwickler sollen Ende dieses Monats über eine neue Enterprise-API-Plattform Zugang zu Grok-2 und Grok-2 mini erhalten
- Die neue API basiert auf einem neuen benutzerdefinierten Technologie-Stack, der Multi-Region-Inference-Deployments mit weltweit niedriger Latenz ermöglicht
- Sie bietet verbesserte Sicherheitsfunktionen wie verpflichtende Multi-Faktor-Authentifizierung, detaillierte Traffic-Statistiken und erweiterte Abrechnungsanalysen
- Sie stellt eine Admin-API bereit, mit der sich Team-, Nutzer- und Abrechnungsverwaltung in bestehende interne Tools und Services integrieren lassen
Was kommt als Nächstes?
- Grok-2 und Grok-2 mini werden auf X eingeführt
- Es besteht große Vorfreude auf verschiedene AI-gestützte Funktionen wie die verbesserte Suche von Grok, tiefere Einblicke in Beiträge auf X und verbesserte Antwortfunktionen
- Bald soll eine Vorschau auf multimodales Verständnis als zentraler Teil der Grok-Erfahrung auf X und über die API veröffentlicht werden
- Seit der Ankündigung von Grok-1 im November 2023 bewegt sich X.AI mit enormem Tempo, getragen von einem kleinen Team mit besonders hoher Talentdichte
- Mit der Einführung von Grok-2 positioniert sich das Unternehmen an der Spitze der AI-Entwicklung
- Der Fokus liegt darauf, mit einem neuen Computing-Cluster die zentralen Fähigkeiten zum Schlussfolgern weiterzuentwickeln
- In den kommenden Monaten sollen noch deutlich mehr Entwicklungen geteilt werden
- „Gesucht werden Menschen, die sich einem kleinen, fokussierten Team anschließen möchten, das sich dem Aufbau der wirkungsvollsten Innovationen für die Zukunft der Menschheit verschrieben hat“
Noch keine Kommentare.