UStackUStack
Claude Opus 4.6 icon

Claude Opus 4.6

Claude Opus 4.6 是 Anthropic 升級的 Opus 系列模型,支援代理式程式碼與搜尋、推理與研究/金融等知識工作;提供測試版 1M token 上下文與開發者控管。

Claude Opus 4.6

Claude Opus 4.6 是什麼?

Claude Opus 4.6 是 Anthropic 的 Opus 系列前沿語言模型,為公司先前 Opus 版本的升級版。設計用於提升代理式程式碼、電腦與工具使用、代理式搜尋,以及推理密集型工作(包含金融及其他知識工作)的效能。

此模型旨在更可靠地處理較長、多步驟任務,並在大規模程式碼庫中有效運作。Anthropic 也指出,Opus 4.6 引入測試版 1M token 上下文視窗,並新增開發者可平衡智慧、速度與成本的控制功能。

主要功能

  • 改善程式碼效能,包含更強的規劃能力,以及更好的程式碼審核/除錯,以捕捉模型自身的錯誤。
  • 更長時間範圍的「代理式」任務執行:Anthropic 表示,此模型可維持代理式任務更長的執行時段。
  • 在大規模程式碼庫中更可靠運作,具備更好的導航與變更辨識,適用於真實系統任務。
  • Opus 4.6 的測試版 1M token 上下文視窗,可支援比先前版本更大的輸入與更長對話。
  • 在代理式搜尋與推理基準測試中獲得更高分數,包含 Terminal-Bench 2.0 與 Humanity’s Last Exam。
  • API 與產品更新支援代理工作流程,包含壓縮(總結自身上下文)、適應性思考,以及透過 /effort 參數的努力度控制。

如何使用 Claude Opus 4.6

  • 透過 claude.ai 使用 Claude Opus 4.6 進行互動工作,或透過 Claude API 存取開發者工作流程。
  • 若使用 API,請以 claude-opus-4-6 參照此模型。
  • 對於較長執行任務,Anthropic 建議使用 API 壓縮來總結上下文,讓執行可持續而不立即觸及限制。
  • 若模型在簡單任務上花費過久時間,Anthropic 建議將努力度設定從預設高值降至 medium,使用 /effort 參數。

使用情境

  • 具規劃與除錯的代理式程式碼: 使用 Opus 4.6 將複雜程式碼需求拆解為步驟,並透過反覆審核與除錯產生程式碼。
  • 大規模程式碼庫更新: 套用此模型導航大型儲存庫,並辨識滿足特定需求所需的變更。
  • 代理式研究與資訊搜尋: 用於多步驟搜尋任務,特別是資訊難以定位且需更深層推理的情境。
  • 金融分析與領域工作: 在 Anthropic 評估提及的金融及其他高價值知識工作環境中執行分析任務。
  • 文件與簡報工作流程: 建立與編輯日常辦公產出,包含文件、試算表與簡報,Excel 改善與 PowerPoint 研究預覽均有提及。

常見問題

  • 1M token 上下文視窗是否所有使用者皆可用? Anthropic 指定為 Opus 4.6 的 測試版

  • 如何控制模型思考程度? 網站描述 /effort 參數;若模型過度思考任務,建議將努力度從預設(高)降至 medium

  • Opus 4.6 能否處理長時間任務? Anthropic 提及 API 壓縮來總結自身上下文,讓長時間任務持續而不立即觸及限制。

  • 何處可存取 Claude Opus 4.6? 可於 claude.ai、透過 API,以及 主要雲端平台 使用。

  • 此頁是否有定價資訊? 有。定價為 $5 / $25 每百萬 token;完整細節參考 Anthropic 定價頁面。

替代方案

  • 其他前沿或「推理」語言模型: 若依多步驟推理與搜尋效能選擇,可考慮同類前沿推理系統的替代模型。
  • 無代理式強調的通用程式碼/聊天模型: 對於主要需短期程式碼協助而非長時間代理工作流程的團隊,更簡單的程式碼專用模型可降低複雜度。
  • 搜尋與研究工作流程專用工具: 若主要需求為線上找尋資訊,專用擷取/搜尋工作流程(搭配通用模型)可替代單一模型的端到端代理式搜尋。
  • 試算表與文件自動化解決方案: 對於辦公生產力任務,替代方案包含試算表/文件自動化平台或巨集,視是否需自然語言互動與代理式執行而定。
Claude Opus 4.6 | UStack