1 Punkte von GN⁺ 2025-02-22 | Noch keine Kommentare. | Auf WhatsApp teilen
  • Sky-T1

  • O1-Preview-Modell für 450 US-Dollar trainieren

    • Modelle wie O1 und Gemini 2.0 zeigen eine hervorragende Denkfähigkeit beim Lösen komplexer Aufgaben und erreichen dies durch lange interne Denkprozesse.
    • Da es jedoch keinen Zugang zu technischen Details und Modellgewichten gibt, stellt dies eine Hürde für die Beteiligung von Wissenschaft und Open-Source-Community dar.
    • Als Reaktion darauf sind einige bemerkenswerte Bemühungen entstanden, Open-Weight-Reasoning-Modelle für den Mathematikbereich zu trainieren, etwa Still-2 und Journey.
    • Das NovaSky-Team der UC Berkeley untersucht verschiedene Techniken, um die Reasoning-Fähigkeiten von Basis- und Instruction-Tuning-Modellen weiterzuentwickeln.
    • Diese Forschung erreicht auf demselben Modell nicht nur in Mathematik, sondern auch beim Coding eine wettbewerbsfähige Reasoning-Performance.
  • Mitwirkende

    • Dacheng Li, Shiyi Cao, Shu Liu, Tyler Griggs, Simon Mo, Shishir G. Patil, Joseph E. Gonzalez, Ion Stoica

Noch keine Kommentare.

Noch keine Kommentare.