Composer 2.5

什麼是 Composer 2.5？

Composer 2.5 是可在 Cursor 使用的 AI 程式碼模型。相較於 Composer 2，它被描述為大幅升級版本，在長時間 agentic 任務上表現更強、指令遵循更好，且協作行為更一致。

此模型建立在與 Composer 2 相同的開源 checkpoint 上，也就是 Moonshot 的 Kimi K2.5，但另外透過多種方法訓練，以提升智慧與可用性。根據來源，訓練流程包含擴大規模的強化學習、更複雜的 RL 環境、精準文字回饋，以及更多以真實程式碼庫為基礎的合成任務。

更佳的長程任務處理：Composer 2.5 設計用於長時間的 agentic 工作，在多次 rollout、跨越大量 token 與多次工具呼叫時仍能維持效能。
更可靠的指令遵循：模型經過訓練，能更一致地遵守複雜指令，這對包含多步驟與多項限制的程式開發流程很重要。
RL 中的精準文字回饋：訓練可在特定有問題的回合上下文中插入局部提示，接著將所需行為蒸餾到該軌跡位置的 policy 中。
擴充的合成任務訓練：Composer 2.5 使用的合成任務數量是 Composer 2 的 25 倍，任務以真實程式碼庫與可驗證獎勵為基礎。
超越基準分數的行為調校：訓練流程也會調整溝通風格與 effort calibration，來源指出這些對實際可用性很重要。
建立於開源 checkpoint 之上：Composer 2.5 延續自 Moonshot 的 Kimi K2.5 checkpoint，同時 Cursor 也提到與 SpaceXAI 合作，從零訓練出一個更大規模的模型。

在 Cursor 中，使用者會選擇 Composer 2.5 作為程式開發與 agentic 任務的模型。它適合需要長時間互動、工具使用、程式碼變更與反覆精修的工作流程。

典型流程是先交給模型一個程式任務，讓它檢查程式碼庫、依指示執行、需要時呼叫工具，然後再檢視產生的變更或說明。當任務耗時較長或需要嚴格遵守限制時，特別適合使用。

Composer 2.5 是新產品還是模型更新？
它是 Cursor 中新版的 Composer，定位為 Composer 2 的升級版。

來源有沒有說 Composer 2.5 使用和 Composer 2 不同的 checkpoint？
沒有。來源指出它建立在與 Composer 2 相同的開源 checkpoint 上：Moonshot 的 Kimi K2.5。

訓練上有什麼改變？
來源強調擴大訓練、更多複雜 RL 環境、精準文字回饋，以及更大規模的合成任務集合。

它主要是為了 benchmark 表現嗎？
不只是。來源除了智慧之外，也強調行為與可用性改善，包括溝通風格與 effort calibration。