UStackUStack
Composer 2.5 icon

Composer 2.5

Composer 2.5 是可在 Cursor 使用的 AI 程式碼模型,專為長時間 agentic 任務、更可靠的指令遵循與更一致的協作行為而設計,採用擴展 RL、精準文字回饋與更大規模合成程式碼庫任務訓練。

Composer 2.5

什麼是 Composer 2.5?

Composer 2.5 是可在 Cursor 使用的 AI 程式碼模型。相較於 Composer 2,它被描述為大幅升級版本,在長時間 agentic 任務上表現更強、指令遵循更好,且協作行為更一致。

此模型建立在與 Composer 2 相同的開源 checkpoint 上,也就是 Moonshot 的 Kimi K2.5,但另外透過多種方法訓練,以提升智慧與可用性。根據來源,訓練流程包含擴大規模的強化學習、更複雜的 RL 環境、精準文字回饋,以及更多以真實程式碼庫為基礎的合成任務。

主要功能

  • 更佳的長程任務處理:Composer 2.5 設計用於長時間的 agentic 工作,在多次 rollout、跨越大量 token 與多次工具呼叫時仍能維持效能。
  • 更可靠的指令遵循:模型經過訓練,能更一致地遵守複雜指令,這對包含多步驟與多項限制的程式開發流程很重要。
  • RL 中的精準文字回饋:訓練可在特定有問題的回合上下文中插入局部提示,接著將所需行為蒸餾到該軌跡位置的 policy 中。
  • 擴充的合成任務訓練:Composer 2.5 使用的合成任務數量是 Composer 2 的 25 倍,任務以真實程式碼庫與可驗證獎勵為基礎。
  • 超越基準分數的行為調校:訓練流程也會調整溝通風格與 effort calibration,來源指出這些對實際可用性很重要。
  • 建立於開源 checkpoint 之上:Composer 2.5 延續自 Moonshot 的 Kimi K2.5 checkpoint,同時 Cursor 也提到與 SpaceXAI 合作,從零訓練出一個更大規模的模型。

如何使用 Composer 2.5

在 Cursor 中,使用者會選擇 Composer 2.5 作為程式開發與 agentic 任務的模型。它適合需要長時間互動、工具使用、程式碼變更與反覆精修的工作流程。

典型流程是先交給模型一個程式任務,讓它檢查程式碼庫、依指示執行、需要時呼叫工具,然後再檢視產生的變更或說明。當任務耗時較長或需要嚴格遵守限制時,特別適合使用。

使用情境

  • 長時間程式任務:當 agent 需要在大範圍 rollout 中做出多次決策時很有用,例如編輯多個檔案或反覆迭代某個功能。
  • 複雜指令遵循:適合有詳細限制的任務,例如在修改實作細節時維持既有行為。
  • 重工具工作流程:當模型必須反覆使用工具並從局部錯誤中恢復時很有幫助,例如工具不可用或呼叫失敗。
  • 以程式碼庫為基礎的合成任務:支援模型在真實程式碼庫上配合測試與可驗證結果的訓練與評估設定。
  • 重視溝通的協作:當使用者不只在乎正確性,也在乎更清楚的說明、風格與適度投入時特別相關。

常見問題

Composer 2.5 是新產品還是模型更新?
它是 Cursor 中新版的 Composer,定位為 Composer 2 的升級版。

來源有沒有說 Composer 2.5 使用和 Composer 2 不同的 checkpoint?
沒有。來源指出它建立在與 Composer 2 相同的開源 checkpoint 上:Moonshot 的 Kimi K2.5。

訓練上有什麼改變?
來源強調擴大訓練、更多複雜 RL 環境、精準文字回饋,以及更大規模的合成任務集合。

它主要是為了 benchmark 表現嗎?
不只是。來源除了智慧之外,也強調行為與可用性改善,包括溝通風格與 effort calibration。

替代方案

  • Composer 2:先前的 Cursor 模型版本,可作為比較新版訓練與行為變化的直接基準。
  • 通用型程式碼代理:其他專注於程式碼生成與工具使用的 AI 程式助理,但在長程任務與行為調校上的處理方式可能不同。
  • IDE 整合式 LLM 助理:支援程式開發流程的編輯器型助理,但未必採用 Composer 2.5 所述的同樣 RL 重訓練方式。
  • 人工程式碼審查與迭代開發:適合偏好對長而複雜變更保有手動控制的團隊,尤其在行為精準度很重要時。
Composer 2.5 | UStack