1 Punkte von recast7838 4 시간 전 | 1 Kommentare | Auf WhatsApp teilen

Moonshot AI hat das agentenzentrierte Open-Weights-Coding-Modell "Kimi K2.7-Code" veröffentlicht, das die Coding-Leistung im Vergleich zum Vorgängermodell deutlich verbessert und den Verbrauch von Inference-Tokens um 30 % reduziert.


Vollständige Übersetzung

In dieser Woche hat Moonshot AI Kimi K2.7-Code veröffentlicht. Es handelt sich um ein agentenzentriertes, auf Coding spezialisiertes Modell. Die Modellgewichte werden unter einer modifizierten MIT-Lizenz auf Hugging Face bereitgestellt. Es kann außerdem über die Kimi API und Kimi Code genutzt werden. K2.7-Code zielt nicht auf allgemeine Konversationen, sondern auf langfristige Software-Engineering-Aufgaben. Das Modell plant über mehrere Schritte hinweg, verändert Code, führt Tools aus und übernimmt das Debugging. Moonshot AI bietet das Modell in Kombination mit einer abonnementsbasierten Coding-Plattform an.

Kimi K2.7-Code Spezifikationen

K2.7-Code ist ein Mixture-of-Experts-(MoE)-Modell. Es verfügt insgesamt über 1 Billion (1T) Parameter, von denen 32 Milliarden (32B) Parameter pro Token aktiviert werden. Diese Architektur verwendet 8 ausgewählte Experten pro Token unter insgesamt 384 Experten, wobei 1 Experte gemeinsam genutzt wird. Das Modell besteht aus insgesamt 61 Layern, darunter 1 Dense-Layer.

Als Attention-Mechanismus wird MLA verwendet, und im Feedforward-Pfad kommt SwiGLU zum Einsatz. Der MoonViT-Vision-Encoder fügt für Bild- und Videoeingaben 400 Millionen (400M) Parameter hinzu. Das Modell wird mit nativer INT4-Quantisierung ausgeliefert. Das Kontextfenster beträgt 256K Token (262.144). Es gibt zwei Einschränkungen. Der Thinking mode ist verpflichtend; wird er deaktiviert, gibt die API einen Fehler zurück. Die Sampling-Parameter sind fest auf temperature 1.0, top_p 0.95, n 1 und penalty 0.0 gesetzt. Die standardmäßige maximale Ausgabe beträgt 32.768 Token. Self-Hosting ist mit vLLM, SGLang und KTransformers möglich. Das Hugging-Face-Repository ist mit etwa 595 GB auf dem Datenträger sehr groß. Das Modell ist nicht für Notebooks gedacht, sondern auf Deployments auf Server-Niveau ausgerichtet.

Benchmark-Ergebnisse

Das Moonshot-Team hat Ergebnisse aus 6 Benchmarks veröffentlicht. Dabei wurde K2.7-Code mit K2.6, GPT-5.5 und Claude Opus 4.8 verglichen. K2.7-Code übertraf K2.6 in allen Kategorien. Den größten Zuwachs im Coding-Bereich zeigte Kimi Code Bench v2, wo der Wert von 50,9 % auf 62,0 % stieg.

K2.7-Code erreichte im MCP Mark Verified Benchmark 81,1 % und lag damit vor Opus 4.8 mit 76,4 %. Auch im MLS Bench Lite erzielte es Werte nahe an GPT-5.5. K2.7-Code wurde in Kimi Code CLI ausgeführt, während GPT-5.5 in Codex xhigh und Opus 4.8 in einer Claude Code xhigh-Umgebung getestet wurden.

1 Kommentare

 
cnaa97 1 시간 전

Wirklich beeindruckend.