3 Punkte von xguru 2025-05-02 | Noch keine Kommentare. | Auf WhatsApp teilen
  • Zum ersten Jahrestag der Veröffentlichung der Phi-Serie, die das Potenzial kleiner Sprachmodelle (SLM) bewiesen hat, wurde eine neue Modellfamilie vorgestellt, die für Reasoning optimiert ist und auf mehrstufiges Denken spezialisiert ist
  • Trotz der geringen Parameterzahl zeigen die Modelle eine Leistung, die mit großen Modellen vergleichbar ist
  • Phi-4-reasoning: 14B Parameter, SFT (Supervised Fine-Tuning) mit hochwertigen Reasoning-Daten
  • Phi-4-reasoning-plus: zusätzlich RL (Reinforcement Learning) auf dem obigen Modell, höhere Genauigkeit durch den Einsatz von 1,5-mal mehr Tokens
  • Phi-4-mini-reasoning: Trotz einer Größe von nur 3.8B übertrifft es in verschiedenen Mathematik-Benchmarks Modelle, die mehr als doppelt so groß sind, und eignet sich für Mobile- und Edge-Umgebungen
    • Übertrifft verschiedene Modelle wie OpenThinker-7B, Llama-3.2-3B und die DeepSeek-R1-Familie in Bezug auf die Leistung
    • Erreicht ähnliche oder bessere Ergebnisse als OpenAI o1-mini, insbesondere bei mathematiklastigen Tests wie Math-500 und GPQA Diamond
  • Diese Modelle werden auf Copilot+ PCs auch als Phi Silica, eine NPU-optimierte Version, bereitgestellt und ermöglichen dadurch eine schnelle und effiziente Ausführung in Windows-Umgebungen
  • Verfügbar über Azure AI Foundry und HuggingFace:
  • Entwickler-APIs und lokale Integrationswerkzeuge werden ebenfalls bereitgestellt, sodass sich die Modelle leicht in verschiedene Umgebungen integrieren lassen

Noch keine Kommentare.

Noch keine Kommentare.