- Qwen2-Math, das auf dem Qwen2-LLM basiert, übertrifft die mathematischen Fähigkeiten von Open-Source-Modellen und geschlossenen Modellen (z. B. GPT-4o) deutlich
- Eine Serie mathematikspezialisierter Large Language Models, darunter Qwen2-Math und Qwen2-Math-Instruct-1.5B/7B/72B
- Es zeigte sich, dass das größte Modell, Qwen2-Math-72B-Instruct, aktuelle Modelle wie GPT-4o, Claude-3.5-Sonnet, Gemini-1.5-Pro und Llama-3.1-405B übertrifft
- Derzeit unterstützen die Modelle nur Englisch. Ein zweisprachiges Mathematikmodell (Englisch und Chinesisch) soll in Kürze veröffentlicht werden
1 Kommentare
Alibaba, Qwen-2-Modell vorgestellt
Qwen1.5-110B : das erste 100B+-Modell der Open-Source-LLM-Serie Qwen1.5 von Alibaba
Alibaba stellt das Open-Source-AI-Modell QWEN vor