UStackUStack
Composer 2 icon

Composer 2

Composer 2 是 Cursor 內的程式碼模型,支援長時間、多步驟任務,並提升 Terminal-Bench 2.0 與 SWE-bench Multilingual 成績。

Composer 2

Composer 2 是什麼?

Composer 2 是 Cursor 內的程式碼模型,專為需要多步驟推理與長行動序列的程式碼任務設計,模型特別針對代理式程式碼工作負載進行訓練與最佳化。

Cursor 表示,Composer 2 在基準測試中表現優於 Composer 1(包括 Terminal-Bench 2.0 與 SWE-bench Multilingual),歸因於持續預訓練後接續針對長時間程式碼任務的強化學習。

主要特色

  • 可在 Cursor 使用:Composer 2 可直接在 Cursor 環境中用於程式碼輔助。
  • 程式碼基準測試表現提升:Cursor 指出在多項基準測試中大幅進步,包括 Terminal-Bench 2.0 與 SWE-bench Multilingual。
  • 針對長時間任務的強化學習:模型透過強化學習訓練長行動序列,針對需數百個動作的任務。
  • 多種定價模式(含更快速變體):Composer 2 有標準選項與更快速變體,各有不同 token 定價。
  • 評估方法與基準測試背景:Cursor 說明其公布分數的計算方式(包括 Terminal-Bench 2.0 使用 Harbor,以及每個模型-代理對的多輪迭代),有助釐清「效能」定義。

如何使用 Composer 2

  1. 開啟 Cursor,從模型選項選擇 Composer 2。
  2. 開始程式碼任務(例如,請助理實作或除錯程式碼)。
  3. 若重視速度,切換至 Cursor 模型詳情中提及的更快速變體。
  4. 檢視輸出並迭代,依特定程式碼目標調整。

使用情境

  • 終端機程式碼工作流程:當任務涉及命令列或終端機步驟、橫跨多個動作時使用 Composer 2,符合 Cursor 對 Terminal-Bench 2.0 的重點。
  • 修復或實作真實程式碼庫變更:針對類似 SWE-bench Multilingual 評估的任務,使用 Composer 2 處理多步驟程式碼變更。
  • 長、多步驟開發任務:當程式碼請求預期涉及多輪迭代動作(數百步驟,依 Cursor 描述)時,Composer 2 適合此模式。
  • 注重成本的開發:選擇標準 Composer 2 定價模式以獲公布的輸入/輸出 token 費率;若需速度則選更快速變體,接受不同 token 經濟。

常見問題

Cursor 用哪些基準測試報告 Composer 2 效能?

Cursor 提及 Terminal-Bench 2.0SWE-bench Multilingual 的進步,並說明 Terminal-Bench 2.0 的 Cursor 分數使用 Harbor 評估框架 與預設基準設定計算。

Composer 2 多少錢?

Cursor 列出 Composer 2 的 $0.50/M 輸入 token$2.50/M 輸出 token,另有 更快速變體 定價 $1.50/M 輸入$7.50/M 輸出 token。

Composer 2 支援長行動序列嗎?

Cursor 表示 Composer 2 訓練用以解決需 數百個動作 的挑戰性任務。

哪裡可以試用 Composer 2?

Cursor 表示 Composer 2 可在 Cursor 使用,並提及可在 Cursor 新介面早期 alpha 版 試用。

Cursor 只有 Composer 2 模型嗎?

Cursor 文章討論 Composer 2 與其他模型,指出非 Composer 2 模型使用官方排行榜最高分與 Cursor 基礎設施記錄分數的最大值。文章未列出所有可用模型,但明確提及 Cursor 的模型選單。

替代方案

  • Cursor 中的其他程式碼模型:若需不同速度/成本權衡,可直接切換 Cursor 內其他模型選項,Cursor 討論「其他快速模型」並提供 Composer 2 的更快速變體。
  • 無此特定模型的代理式程式碼工作流程:若工作流程主要為終端自動化與迭代步驟,可考慮其他聚焦終端/代理評估模式的模型類型(不暗示特定品牌)。
  • 通用 LLM 程式碼輔助:對於較簡單的程式碼產生或編輯任務,通用程式碼助理模型即可,但 Composer 2 特別定位於長時間、多動作任務。
Composer 2 | UStack