10 Punkte von xguru 2025-02-19 | 1 Kommentare | Auf WhatsApp teilen
  • Die Mission von xAI ist es, das Wesen des Universums zu verstehen; dafür entwickelt das Unternehmen Grok, eine KI, die die Suche nach Wahrheit an erste Stelle setzt
  • Grok 3 zeigt eine mehr als 10-fache Leistungssteigerung gegenüber Grok 2, ermöglicht durch die Arbeit eines herausragenden Teams und massive Rechenressourcen
    • „Grok“ ist ein Begriff aus Heinleins Roman Fremder in einer fremden Welt und bedeutet, „etwas vollständig und tiefgreifend zu verstehen“
    • Auch Empathie spielt eine wichtige Rolle
  • xAI begann vor 17 Monaten mit seinem ersten Modell; Grok 1 war ein Modell mit 314B (314 Milliarden) Parametern
    • Danach folgten Grok 1.5 und Grok 2, bevor die Entwicklung zu Grok 3 führte, mit sprunghaft verbesserter Leistung
  • Rechenzentrum: xAI hat ein eigenes Rechenzentrum aufgebaut, um die Entwicklung von Grok zu beschleunigen
    • Die erste GPU-Cluster mit 100.000 GPUs wurde in 122 Tagen in Betrieb genommen; anschließend wurde die Kapazität in nur 92 Tagen verdoppelt (200K)
    • Dabei handelt es sich um den weltweit größten vollständig vernetzten H100-Cluster, dessen gesamte GPU- und Rechenleistung zur Verbesserung von Grok eingesetzt wurde
  • Grok 3: mehr als 10-fache Leistungssteigerung gegenüber Grok 2 (tatsächlich mehr als 15-fach)
    • Das Pretraining wurde Anfang Januar abgeschlossen, und das Modell wird weiterhin trainiert
  • Benchmarks: Grok 3 zeigt starke Leistung in allgemeinem mathematischem Schlussfolgern, wissenschaftlichen Aufgaben und beim Coding
    • Auch die kleinere Version, Grok 3 Mini, ist mit Wettbewerbern auf Augenhöhe
    • Besonders bei Aufgaben der Highschool-Mathematik-Olympiade (AIME) wurden Spitzenwerte erzielt
    • In der aktuellen Chatbot-Bewertung (Cha Arena) erreichte es einen ELO-Score von über 1.400 und belegte damit Platz 1 unter allen Modellen

Neue Funktionen von Grok 3

  • Fortgeschrittenes Schlussfolgern (Advanced Reasoning)
    • Grok 3 liefert nicht nur einfache Antworten, sondern verfügt über die Fähigkeit, über einen tiefgehenden Denkprozess zu Lösungen zu gelangen
    • Die Fähigkeit, Probleme zu analysieren, Fehler zu finden und verschiedene Möglichkeiten zu erkunden, wurde verbessert
    • Praxisbeispiele:
      • Berechnung von Flugbahnen für Marsreisen: Simulation einer Erd-Mars-Hin-und-zurück-Flugbahn mit visueller Ausgabe
      • Entwicklung eines neuen Spiels: spontane Erstellung eines neuen Spiels, das Tetris und Zuma kombiniert
  • Echtzeit-Lernfähigkeit von Grok 3
    • Täglich gibt es neue Verbesserungen, und schon ein Unterschied von einem Tag zeigt Leistungsunterschiede
    • Selbst während des Testprozesses entwickelt sich das Modell kontinuierlich weiter
  • Technische Verbesserungen mit Grok 3
    • Grok 3 verkürzt intern hunderte Arbeitsstunden bei Coding und Problemlösung
    • Durch das Lösen von Mathematik- und Competitive-Programming-Aufgaben lernt es die Fähigkeit, eigene Fehler zu erkennen und zu korrigieren

Funktionen der nächsten Generation: Agenten auf Basis von Grok 3

  • Deep Search
    • Eine neue KI-Suchmaschine, die tiefere Informationen liefert als gewöhnliche Suchmaschinen
    • Sie analysiert Informationen aus mehreren Websites und vergleicht aktuelle Informationen, um die verlässlichste Antwort zu liefern
    • Beispiele:
      • Abfrage des nächsten Starttermins von Starship
      • Analyse beliebter Builds in Path of Exile
      • Vorhersage des Siegers des Basketballturniers March Madness
  • KI-Sprachassistent (Voice Assistant)
    • Es soll eine Funktion hinzukommen, mit der Nutzer mit Grok so kommunizieren können, als würden sie ein echtes Gespräch führen
    • Grok wandelt nicht nur Text um, sondern kann unter Berücksichtigung von Stimmfarbe, Emotion und Intonation natürlich kommunizieren

Veröffentlichung von Grok 3 und Zukunftspläne

  • Zeitplan für die Veröffentlichung
    • Ab heute wird die Beta-Version von Grok 3 für Premium+-Abonnenten bereitgestellt
    • Nach einem Update der X-App (ehemals Twitter) können die neuen Funktionen genutzt werden
    • Start der eigenständigen Website grok.com sowie eigener Grok-Apps (iOS/Android)
  • Neue Abo-Option: Super Grok
    • Einführung des Abomodells Super Grok für Nutzer, die die neuesten Funktionen besonders schnell ausprobieren möchten
  • Weitere Pläne
    • Grok-3-API geplant (innerhalb weniger Wochen)
    • Open-Source-Veröffentlichung von Grok 3 geplant (innerhalb der kommenden Monate)
    • Aufbau eines noch leistungsfähigeren Clusters (5-fache Leistung des bestehenden)
    • Geplant ist außerdem die Gründung eines AI-Game-Studios, um die Entwicklung KI-basierter Spiele zu beschleunigen

Fazit

  • Grok 3 erschließt eine neue Dimension von KI-Modellen, und xAI arbeitet daran, es weiter voranzubringen
  • Mit starker Schlussfolgerungsfähigkeit, KI-basierter Suchmaschine und Sprachassistentenfunktionen entwickelt sich Grok zunehmend zu einem echten KI-Assistenten
  • Elon Musk prognostiziert, dass KI künftig akademische Leistungen wie die Fields-Medaille erreichen wird

1 Kommentare

 
GN⁺ 2025-02-19
Hacker-News-Meinungen
  • Karpathy beschrieb seinen ersten Eindruck von Grok als auf dem Niveau von OpenAIs o1-pro
  • Grok hat in einem Benchmark die Spitzengruppe erreicht
  • Der Wettbewerb im LLM-Bereich wird härter, was gute Nachrichten für Verbraucher sind
    • Hoffentlich schöpft kein monopolartiges Unternehmen den gesamten Wert ab
  • Es gibt Hinweise darauf, dass sich hochmoderne LLMs auch mit geringeren Kosten bauen lassen
  • Die Aufzeichnung war nicht inspirierend
    • Es gab nichts Neues, und es waren Inhalte, die man bereits kannte
  • Viele Menschen glauben, dass OpenAI nachgeahmt wird
    • OpenAI zeigt aus dieser Sicht weiterhin, wozu es in der Lage ist
  • Man muss anerkennen, dass xAI schnell aufgeholt hat
    • Nicht nur beim Modell, sondern auch beim Produkt liegt es vorn
  • Das Beste an Groks konkurrenzfähigen Ergebnissen könnte sein, die öffentliche Wahrnehmung von ChatGPT zu durchbrechen
  • Karpathy glaubt, dass dies auf dem Niveau von o1-pro ist
  • OpenAI beweist erneut, dass es keine technischen Schutzgräben gibt
    • Elons Angebot zur Übernahme von OpenAI erscheint plausibel
  • Elon ist in China beliebt und kann daher leicht AI-Ingenieure gewinnen
    • Er kann Aktien von xAI/XSpace/Neurallink anbieten
  • Viel Glück an die Investoren, die OpenAI mit mehr als 100 Milliarden Dollar bewerten
  • Es ist geplant, die Gewichte von Grok 2 zu veröffentlichen
  • Man stellt sich eine Zukunft vor, in der LLMs personalisierte Werbung einfügen