- Zum ersten Jahrestag der Veröffentlichung der Phi-Serie, die das Potenzial kleiner Sprachmodelle (SLM) bewiesen hat, wurde eine neue Modellfamilie vorgestellt, die für Reasoning optimiert ist und auf mehrstufiges Denken spezialisiert ist
- Trotz der geringen Parameterzahl zeigen die Modelle eine Leistung, die mit großen Modellen vergleichbar ist
- Phi-4-reasoning: 14B Parameter, SFT (Supervised Fine-Tuning) mit hochwertigen Reasoning-Daten
- Phi-4-reasoning-plus: zusätzlich RL (Reinforcement Learning) auf dem obigen Modell, höhere Genauigkeit durch den Einsatz von 1,5-mal mehr Tokens
- Phi-4-mini-reasoning: Trotz einer Größe von nur 3.8B übertrifft es in verschiedenen Mathematik-Benchmarks Modelle, die mehr als doppelt so groß sind, und eignet sich für Mobile- und Edge-Umgebungen
- Übertrifft verschiedene Modelle wie OpenThinker-7B, Llama-3.2-3B und die DeepSeek-R1-Familie in Bezug auf die Leistung
- Erreicht ähnliche oder bessere Ergebnisse als OpenAI o1-mini, insbesondere bei mathematiklastigen Tests wie Math-500 und GPQA Diamond
- Diese Modelle werden auf Copilot+ PCs auch als Phi Silica, eine NPU-optimierte Version, bereitgestellt und ermöglichen dadurch eine schnelle und effiziente Ausführung in Windows-Umgebungen
- Verfügbar über Azure AI Foundry und HuggingFace:
- Entwickler-APIs und lokale Integrationswerkzeuge werden ebenfalls bereitgestellt, sodass sich die Modelle leicht in verschiedene Umgebungen integrieren lassen
Noch keine Kommentare.