UStackUStack
Command A+ icon

Command A+

Command A+ 是 Cohere 的開源企業語言模型,適用於複雜推理、多模態與多語言代理工作流程及工具使用,支援私有部署,可透過相容開源推理框架或 Cohere 的託管 Model Vault 執行。

Command A+

什麼是 Command A+?

Command A+ 是 Cohere 的開源企業大型語言模型,適用於企業代理式任務。它旨在處理複雜推理、多模態輸入、多語言工作、檢索增強生成與工具使用,同時仍保持足夠效率,能以相對精簡的硬體執行,對這個規模的模型而言表現不錯。

這個模型被定位為早期 Command A 變體的整合後繼者,將推理、視覺、翻譯與工具使用能力整合到單一稀疏專家混合架構中。Cohere 也強調私有部署與開發者控制,權重可依 Apache 2.0 授權下載,並支援開源推理框架。

主要功能

  • 稀疏專家混合架構:Command A+ 是一個 MoE 模型,總參數 218B、啟用參數 25B,旨在平衡能力與推理效率。
  • 長上下文支援:支援 128K 輸入上下文與最多 64K 生成,適合長篇文件、延伸代理工作流程與多步驟互動。
  • 多模態輸入支援:模型接受文字、圖片與工具使用輸入,可用於文件理解與其他混合輸入任務。
  • 多語言涵蓋:支援 48 種語言,適合跨語言企業工作流程與全球部署。
  • 開放部署選項:模型採用 Apache 2.0 授權,可用 vLLM 或 Transformers 執行,權重可從 Hugging Face 取得,並可在 Cohere 的 Model Vault 中部署。
  • 顧及硬體的部署:Cohere 表示,依部署設定不同,它可在低至 1× B200(W4A4)或 2× H100(W4A4)上執行。

如何使用 Command A+?

使用者通常會先從 Hugging Face 下載模型權重,或在 Cohere 的託管 Model Vault 環境中部署。之後,團隊可使用 vLLM 或 Transformers 等支援框架,將模型整合到推理或代理工作流程中。

實際使用時,可提供文字或圖片輸入,在需要時連接工具,並針對檢索、推理或文件處理等任務進行設定。Cohere 參考的實作指南是設定與部署細節的主要起點。

使用情境

  • 企業代理工作流程:建立需要在長上下文中推理、呼叫工具,並於受控流程中多步驟回應的代理。
  • 檢索增強生成:使用模型回答基於連結檔案、知識庫或其他檢索到的企業資料的問題。
  • 多模態文件處理:分析結合文字與圖片的文件,例如報告、掃描資料或具視覺結構的檔案。
  • 多語言助理:支援需要理解或生成多種語言文字的工作流程。
  • 程式撰寫與技術任務:將模型用於代理式程式撰寫、指令遵循,以及其他重視推理與工具使用的文字密集型任務。

常見問題

Command A+ 是開源的嗎?
是。Cohere 表示它是依 Apache 2.0 授權釋出。

它支援哪些類型的輸入?
來源列出文字、圖片與工具使用輸入。

可以私有執行嗎?
可以。頁面將 Command A+ 描述為可私有部署,並強調本地或受控部署是目標之一。

支援哪些框架?
Cohere 列出 vLLM 和 Transformers 為支援框架。

有代管部署選項嗎?
有。Cohere 表示 Command A+ 可部署於 Model Vault,作為代管推理環境。

替代方案

  • 較早期的 Command A 模型:Command A+、Command A Reasoning、Command A Vision 與 Command A Translate 都是同系列的相關選項,但 Command A+ 將更多能力整合到單一模型中。
  • 其他用於企業部署的 open-weight LLM:可比擬的選項可能包括適合自架與自訂推理堆疊的大型開放模型,尤其是團隊希望掌控基礎架構與模型行為時。
  • 代管式企業 LLM 平台:偏好 API 或託管工作流程而非自行部署的團隊,可能會選擇代管模型服務,而不是直接執行權重。
  • 專用多模態或推理模型:有些團隊可能偏好針對視覺、翻譯或推理單獨最佳化的較窄模型,而非整合式通用代理模型。
Command A+ | UStack