Cursor AI veröffentlicht das Modell Composer 1.5
(cursor.com)Vor einigen Monaten haben wir Composer 1 veröffentlicht, unser erstes agentenbasiertes Coding-Modell. Seitdem konnten wir die Coding-Fähigkeiten des Modells deutlich verbessern.
Das neu veröffentlichte Composer 1.5 bietet für den täglichen Einsatz eine starke Balance zwischen Geschwindigkeit und Intelligenz. Composer 1.5 wurde auf Basis desselben vortrainierten Modells entwickelt, wobei das Reinforcement Learning um das 20-Fache skaliert wurde. Die für das Post-Training von Composer 1.5 eingesetzten Rechenressourcen übersteigen die Menge, die für das Vortraining des Basismodells verwendet wurde, bei Weitem.
Mit der Skalierung verbessern sich auch die Coding-Fähigkeiten kontinuierlich. Interne Benchmark-Messungen anhand realer Coding-Probleme zeigen, dass dieses Modell Composer 1 schnell überholt hat und seine Leistung weiter stetig steigt. Besonders bei anspruchsvollen Aufgaben sind die Verbesserungen am deutlichsten.
Composer 1.5 ist ein Reasoning-Modell. Bei der Beantwortung von Anfragen erzeugt das Modell Thinking-Tokens, um über die Codebasis des Nutzers zu schlussfolgern und die nächsten Schritte zu planen. Wir haben bestätigt, dass diese Denkphasen entscheidend für die Intelligenz des Modells sind. Gleichzeitig wollten wir die Geschwindigkeit und Interaktivität von Composer 1.5 für den täglichen Einsatz beibehalten. Um diese Balance zu erreichen, wurde das Modell darauf trainiert, bei einfachen Problemen mit minimalem Nachdenken schnell zu antworten und bei schwierigen Problemen so lange weiterzudenken, bis es eine zufriedenstellende Antwort findet.
Für die Verarbeitung lang laufender Aufgaben verfügt Composer 1.5 über eine eigene Zusammenfassungsfunktion. Dadurch kann das Modell auch dann weiter nach Lösungen suchen, wenn der verfügbare Kontext ausgeschöpft ist. Im Rahmen des Reinforcement Learning (RL) haben wir Composer 1.5 diese Fähigkeit zur Selbstzusammenfassung antrainiert, indem wir das Modell während des Trainings bei ausgeschöpftem Kontext dazu aufgefordert haben, eine hilfreiche Zusammenfassung zu erzeugen. Bei schwierigen Beispielen kann dieser Prozess rekursiv mehrfach auftreten. Wir haben bestätigt, dass das Modell dank der automatischen Zusammenfassung seine ursprüngliche Genauigkeit auch bei Veränderungen der Kontextlänge beibehalten kann.
Composer 1.5 ist ein deutlich leistungsstärkeres Modell als Composer 1 und wird für den interaktiven Einsatz empfohlen. Der Trainingsprozess dieses Modells zeigt, dass sich RL für Coding mit vorhersehbaren Intelligenzsteigerungen kontinuierlich skalieren lässt.
Die Preise sind hier zu finden -> https://cursor.com/docs/models
Noch keine Kommentare.