UStackUStack
Composer 2 icon

Composer 2

Composer 2 是 Cursor 中的编码模型,面向长时间、多步骤编程任务,基准表现优于 Composer 1。$0.50/M 输入、$2.50/M 输出。

Composer 2

Composer 2 是什么?

Composer 2 是 Cursor 中的编码模型。它专为需要多步推理和长动作序列的编码任务而设计,模型针对代理式编码工作负载进行了专门训练和优化。

Cursor 报告称,Composer 2 在基准测试中表现优于 Composer 1(包括 Terminal-Bench 2.0 和 SWE-bench Multilingual),并将提升归因于针对长时间编码任务的持续预训练后续强化学习。

主要特性

  • Cursor 内可用:Composer 2 可直接在 Cursor 环境中用于编码辅助。
  • 编码基准性能提升:Cursor 指出其测量的基准测试均有大幅改进,包括 Terminal-Bench 2.0 和 SWE-bench Multilingual。
  • 针对长时间任务的强化学习:模型通过强化学习在长动作序列上训练,针对需要数百个动作的任务。
  • 多种定价模式(包括更快的变体):Composer 2 有标准选项和更快变体,各有不同的令牌定价。
  • 评估方法和基准背景:Cursor 描述了其报告分数的计算方式(包括 Terminal-Bench 2.0 使用 Harbor,以及每个模型-代理对的多轮迭代),有助于澄清“性能”所指。

如何使用 Composer 2

  1. 打开 Cursor,从模型选项中选择 Composer 2。
  2. 启动编码任务(例如,让助手实现或调试代码)。
  3. 如果速度优先,切换到 Cursor 模型详情中提到的更快变体。
  4. 审查输出并迭代,以适应您的具体编码目标。

使用场景

  • 基于终端的编码工作流:当任务涉及命令行或终端驱动步骤且可能跨越多个动作时,使用 Composer 2,这与 Cursor 对 Terminal-Bench 2.0 的关注一致。
  • 修复或在真实代码库中实现变更:对于类似于 SWE-bench Multilingual 评估的任务,使用 Composer 2 处理多步编码变更。
  • 长多步开发任务:当编码请求预计涉及多次迭代动作(数百步,按 Cursor 描述)时,Composer 2 适用于此类模式。
  • 注重成本的开发:选择标准 Composer 2 定价模式以获取指定的输入/输出令牌费率;选择更快变体以优先速度并接受不同的令牌经济性。

常见问题

Cursor 使用哪些基准报告 Composer 2 性能?

Cursor 提到在 Terminal-Bench 2.0SWE-bench Multilingual 上有改进。它还解释,其 Terminal-Bench 2.0 的 Cursor 分数使用 Harbor 评估框架 和默认基准设置计算。

Composer 2 多少钱?

Cursor 列出 Composer 2 为 $0.50/M 输入令牌$2.50/M 输出令牌。更快变体为 $1.50/M 输入$7.50/M 输出 令牌。

Composer 2 支持长动作序列吗?

Cursor 表示,Composer 2 经过训练以解决需要 数百个动作 的挑战性任务。

哪里可以试用 Composer 2?

Cursor 表示 Composer 2 在 Cursor 中可用,并提到可在 Cursor 新界面的早期 alpha 版 中试用。

Cursor 中只有 Composer 2 一个模型吗?

Cursor 的文章讨论 Composer 2 及其他模型,指出对于 Composer 2 以外的模型,它使用了官方排行榜最高分和 Cursor 基础设施记录分数的最大值。文章未指定所有可用模型,但明确指出 Cursor 有模型菜单。

替代方案

  • Cursor 中其他编码模型:如果需要不同的速度/成本权衡,切换到 Cursor 内其他模型选项是直接替代方案,因为 Cursor 讨论了“其他快速模型”并为 Composer 2 提供了更快变体。
  • 不使用此特定模型的代理式编码工作流:如果您的流程主要涉及终端自动化和迭代步骤,可考虑其他方法,如使用专注于终端/代理评估模式的模型类型(不暗示特定品牌)。
  • 通用 LLM 编码辅助:对于更简单的代码生成或编辑任务,通用编码助手模型可能足够,尽管 Composer 2 专为长时间、多动作任务设计。
Composer 2 | UStack