UStackUStack
Claude Opus 4.6 icon

Claude Opus 4.6

Claude Opus 4.6 是 Anthropic 升级的 Opus 级模型,面向 agentic 编程、agentic 搜索与推理等知识工作,beta 支持 1M 上下文窗口。

Claude Opus 4.6

Claude Opus 4.6 是什么?

Claude Opus 4.6 是 Anthropic 的 Opus 级前沿语言模型,作为公司此前 Opus 版本的升级。它旨在提升 agentic 编程、计算机与工具使用、agentic 搜索以及推理密集型工作(包括金融和其他知识工作任务)的性能。

该模型旨在更可靠地处理更长、多步骤任务,并在更大代码库中有效运行。Anthropic 还指出,Opus 4.6 引入了 1M token 上下文窗口(beta 版),并添加了开发者控制功能,以平衡智能、速度和成本。

主要特性

  • 改进的编程性能,包括更强的规划能力以及更好的代码审查/调试,以捕捉模型自身的错误。
  • 更长时程的“agentic”任务执行:Anthropic 表示该模型可维持更长的 agentic 任务会话。
  • 在更大代码库中更可靠的工作,支持更好的导航和变更识别,适用于真实系统任务。
  • Opus 4.6 的 1M token 上下文窗口(beta 版),支持比以往版本更大的输入和更长的对话。
  • 在 agentic 搜索和推理基准上的更高得分,包括 Terminal-Bench 2.0 和 Humanity’s Last Exam。
  • 针对 agent 工作流的 API 和产品更新,包括支持 compaction(总结自身上下文)、自适应思考,以及通过 /effort 参数的努力度控制。

如何使用 Claude Opus 4.6

  • 通过 claude.ai 使用 Claude Opus 4.6 进行交互式工作,或通过 Claude API 访问以支持开发者驱动的工作流。
  • 如果使用 API,请将模型引用为 claude-opus-4-6
  • 对于较长运行的任务,Anthropic 建议使用 API compaction 来总结上下文,从而在不立即达到限制的情况下继续运行。
  • 如果模型在简单任务上花费时间过长,Anthropic 推荐将努力度从默认高值降低至 medium,使用 /effort 参数。

使用场景

  • 带规划和调试的 agentic 编程: 使用 Opus 4.6 将复杂编程请求分解为步骤,并通过迭代审查和调试生成代码。
  • 大型代码库更新: 应用该模型导航更大仓库,并识别满足特定需求所需的变更。
  • Agentic 研究和信息查找: 使用 Opus 4.6 处理多步骤搜索任务,尤其当信息难以定位且需要更深推理时。
  • 金融分析和领域工作: 在 Anthropic 评估中提到的金融和其他经济价值知识工作环境中运行分析任务。
  • 文档和演示工作流: 创建和编辑日常办公产出,包括文档、电子表格和演示文稿,Excel 改进以及 PowerPoint 研究预览。

常见问题

  • 1M token 上下文窗口对所有用户可用吗? Anthropic 指定其为 Opus 4.6 的 beta 版

  • 如何控制模型思考量? 站点描述了 /effort 参数;如果发现模型在任务上过度思考,推荐将努力度从默认(high)降低至 medium

  • Opus 4.6 能处理长运行任务吗? Anthropic 提到 API compaction 可总结自身上下文,继续长运行任务而不立即遇到限制。

  • 在哪里可以访问 Claude Opus 4.6? 它可在 claude.ai、通过 API 以及 主要云平台 上访问。

  • 本页有定价信息吗? 有。定价为 $5 / $25 每百万 token;完整详情参考 Anthropic 的定价页面。

替代方案

  • 其他前沿或“推理”语言模型: 如果基于多步骤推理和搜索性能选择,可考虑同类前沿推理系统的替代模型。
  • 无 agentic 强调的通用编程/聊天模型: 对于主要需要较短编程帮助而非长时程 agentic 工作流的团队,更简单的编程专注模型可降低复杂性。
  • 搜索和研究工作流专用工具: 如果主要需求是在线查找信息,专用检索/搜索工作流(结合通用模型)可作为端到端 agentic 搜索单一模型的替代。
  • 电子表格和文档自动化解决方案: 对于办公生产力任务,替代方案包括电子表格/文档自动化平台或宏,取决于是否需要自然语言交互和 agentic 执行。