Composer 2

Composer 2 是什么？

Composer 2 是 Cursor 中的编码模型。它专为需要多步推理和长动作序列的编码任务而设计，模型针对代理式编码工作负载进行了专门训练和优化。

Cursor 报告称，Composer 2 在基准测试中表现优于 Composer 1（包括 Terminal-Bench 2.0 和 SWE-bench Multilingual），并将提升归因于针对长时间编码任务的持续预训练后续强化学习。

Cursor 内可用：Composer 2 可直接在 Cursor 环境中用于编码辅助。
编码基准性能提升：Cursor 指出其测量的基准测试均有大幅改进，包括 Terminal-Bench 2.0 和 SWE-bench Multilingual。
针对长时间任务的强化学习：模型通过强化学习在长动作序列上训练，针对需要数百个动作的任务。
多种定价模式（包括更快的变体）：Composer 2 有标准选项和更快变体，各有不同的令牌定价。
评估方法和基准背景：Cursor 描述了其报告分数的计算方式（包括 Terminal-Bench 2.0 使用 Harbor，以及每个模型-代理对的多轮迭代），有助于澄清“性能”所指。

基于终端的编码工作流：当任务涉及命令行或终端驱动步骤且可能跨越多个动作时，使用 Composer 2，这与 Cursor 对 Terminal-Bench 2.0 的关注一致。
修复或在真实代码库中实现变更：对于类似于 SWE-bench Multilingual 评估的任务，使用 Composer 2 处理多步编码变更。
长多步开发任务：当编码请求预计涉及多次迭代动作（数百步，按 Cursor 描述）时，Composer 2 适用于此类模式。
注重成本的开发：选择标准 Composer 2 定价模式以获取指定的输入/输出令牌费率；选择更快变体以优先速度并接受不同的令牌经济性。

Cursor 提到在 Terminal-Bench 2.0 和 SWE-bench Multilingual 上有改进。它还解释，其 Terminal-Bench 2.0 的 Cursor 分数使用 Harbor 评估框架 和默认基准设置计算。

Cursor 列出 Composer 2 为 $0.50/M 输入令牌 和 $2.50/M 输出令牌。更快变体为 $1.50/M 输入 和 $7.50/M 输出 令牌。

Cursor 表示，Composer 2 经过训练以解决需要 数百个动作 的挑战性任务。

Cursor 表示 Composer 2 在 Cursor 中可用，并提到可在 Cursor 新界面的早期 alpha 版 中试用。

Cursor 的文章讨论 Composer 2 及其他模型，指出对于 Composer 2 以外的模型，它使用了官方排行榜最高分和 Cursor 基础设施记录分数的最大值。文章未指定所有可用模型，但明确指出 Cursor 有模型菜单。

Cursor 中其他编码模型：如果需要不同的速度/成本权衡，切换到 Cursor 内其他模型选项是直接替代方案，因为 Cursor 讨论了“其他快速模型”并为 Composer 2 提供了更快变体。
不使用此特定模型的代理式编码工作流：如果您的流程主要涉及终端自动化和迭代步骤，可考虑其他方法，如使用专注于终端/代理评估模式的模型类型（不暗示特定品牌）。
通用 LLM 编码辅助：对于更简单的代码生成或编辑任务，通用编码助手模型可能足够，尽管 Composer 2 专为长时间、多动作任务设计。