Composer 2

Composer 2 是什麼？

Composer 2 是 Cursor 內的程式碼模型，專為需要多步驟推理與長行動序列的程式碼任務設計，模型特別針對代理式程式碼工作負載進行訓練與最佳化。

Cursor 表示，Composer 2 在基準測試中表現優於 Composer 1（包括 Terminal-Bench 2.0 與 SWE-bench Multilingual），歸因於持續預訓練後接續針對長時間程式碼任務的強化學習。

可在 Cursor 使用：Composer 2 可直接在 Cursor 環境中用於程式碼輔助。
程式碼基準測試表現提升：Cursor 指出在多項基準測試中大幅進步，包括 Terminal-Bench 2.0 與 SWE-bench Multilingual。
針對長時間任務的強化學習：模型透過強化學習訓練長行動序列，針對需數百個動作的任務。
多種定價模式（含更快速變體）：Composer 2 有標準選項與更快速變體，各有不同 token 定價。
評估方法與基準測試背景：Cursor 說明其公布分數的計算方式（包括 Terminal-Bench 2.0 使用 Harbor，以及每個模型-代理對的多輪迭代），有助釐清「效能」定義。

終端機程式碼工作流程：當任務涉及命令列或終端機步驟、橫跨多個動作時使用 Composer 2，符合 Cursor 對 Terminal-Bench 2.0 的重點。
修復或實作真實程式碼庫變更：針對類似 SWE-bench Multilingual 評估的任務，使用 Composer 2 處理多步驟程式碼變更。
長、多步驟開發任務：當程式碼請求預期涉及多輪迭代動作（數百步驟，依 Cursor 描述）時，Composer 2 適合此模式。
注重成本的開發：選擇標準 Composer 2 定價模式以獲公布的輸入/輸出 token 費率；若需速度則選更快速變體，接受不同 token 經濟。

Cursor 提及 Terminal-Bench 2.0 與 SWE-bench Multilingual 的進步，並說明 Terminal-Bench 2.0 的 Cursor 分數使用 Harbor 評估框架 與預設基準設定計算。

Cursor 列出 Composer 2 的 $0.50/M 輸入 token 與 $2.50/M 輸出 token，另有 更快速變體 定價 $1.50/M 輸入 與 $7.50/M 輸出 token。

Cursor 表示 Composer 2 訓練用以解決需 數百個動作 的挑戰性任務。

Cursor 表示 Composer 2 可在 Cursor 使用，並提及可在 Cursor 新介面早期 alpha 版 試用。

Cursor 文章討論 Composer 2 與其他模型，指出非 Composer 2 模型使用官方排行榜最高分與 Cursor 基礎設施記錄分數的最大值。文章未列出所有可用模型，但明確提及 Cursor 的模型選單。

Cursor 中的其他程式碼模型：若需不同速度/成本權衡，可直接切換 Cursor 內其他模型選項，Cursor 討論「其他快速模型」並提供 Composer 2 的更快速變體。
無此特定模型的代理式程式碼工作流程：若工作流程主要為終端自動化與迭代步驟，可考慮其他聚焦終端/代理評估模式的模型類型（不暗示特定品牌）。
通用 LLM 程式碼輔助：對於較簡單的程式碼產生或編輯任務，通用程式碼助理模型即可，但 Composer 2 特別定位於長時間、多動作任務。