什么是 Command A+?
Command A+ 是 Cohere 面向企业 agentic 任务的开源大语言模型。它旨在处理复杂推理、多模态输入、多语言工作、检索增强生成和工具调用,同时保持足够高效,可在相对适中的硬件上运行,适合其规模。
该模型被定位为早期 Command A 变体的整合继任者,将推理、视觉、翻译和工具使用能力合并到单一的稀疏混合专家架构中。Cohere 也强调私有部署和开发者控制,模型权重可在 Apache 2.0 许可证下下载,并支持开源推理框架。
主要特性
- 稀疏混合专家架构:Command A+ 是一个 MoE 模型,总参数量为 218B,激活参数为 25B,旨在平衡能力与推理效率。
- 长上下文支持:支持 128K 输入上下文和最高 64K 生成,适用于更长文档、扩展的 agent 工作流和多步骤交互。
- 多模态输入支持:模型接受文本、图像和工具使用输入,可用于文档理解及其他混合输入任务。
- 多语言覆盖:支持 48 种语言,适用于跨语言企业工作流和全球部署。
- 开放部署选项:模型采用 Apache 2.0 许可,可通过 vLLM 或 Transformers 运行,权重可从 Hugging Face 获取,并可在 Cohere 的 Model Vault 中部署。
- 面向硬件的部署:Cohere 表示,具体取决于部署设置,它最少可在 1× B200、W4A4 配置下或 2× H100、W4A4 配置下运行。
如何使用 Command A+?
用户通常先从 Hugging Face 下载模型权重,或将其部署到 Cohere 托管的 Model Vault 环境中。之后,团队可以使用 vLLM 或 Transformers 等受支持框架,将模型集成到推理或 agent 工作流中。
在实际使用中,模型通过提供文本或图像输入来运行,必要时连接工具,并将其配置用于检索、推理或文档处理等任务。Cohere 提到的实施指南是设置和部署细节的主要起点。
使用场景
- 企业 agent 工作流:构建需要在长上下文中进行推理、调用工具,并在受控工作流中多步骤响应的 agent。
- 检索增强生成:用于基于连接的文件、知识库或其他检索到的企业数据回答问题。
- 多模态文档处理:分析结合文本和图像的文档,如报告、扫描材料或具有视觉结构的文件。
- 多语言助手:支持需要理解或生成多种语言文本的工作流。
- 编码和技术任务:将模型用于 agentic 编码、指令遵循以及其他重视推理和工具使用的文本密集型任务。
常见问题
Command A+ 是开源的吗?
是。Cohere 表示它以 Apache 2.0 许可证发布。
它支持哪些类型的输入?
来源中列出了文本、图像和工具使用输入。
可以私有运行吗?
可以。页面将 Command A+ 描述为可私有部署,并强调本地或受控部署是其目标之一。
支持哪些框架?
Cohere 列出了 vLLM 和 Transformers 作为受支持框架。
有托管部署选项吗?
有。Cohere 表示 Command A+ 可作为托管推理环境部署在 Model Vault 中。
替代方案
- 更早的 Command A 模型:Command A+、Command A Reasoning、Command A Vision 和 Command A Translate 都是同一系列中的相关选项,但 Command A+ 将更多这些能力整合到了一个模型中。
- 用于企业部署的其他 open-weight LLM:可比较的选项可能包括面向自托管和自定义推理栈的大型开源模型,尤其适合希望控制基础设施和模型行为的团队。
- 托管企业 LLM 平台:更偏好 API 或托管工作流而非自部署的团队,可能会选择托管模型服务,而不是直接运行权重。
- 专用多模态或推理模型:一些团队可能更青睐针对视觉、翻译或推理单独优化的窄域模型,而不是整合型通用 agent 模型。
替代品
AakarDev AI
AakarDev AI 是一个强大的平台,通过无缝的向量数据库集成简化 AI 应用程序的开发,实现快速部署和可扩展性。
AgentMail
AgentMail 是面向 AI 代理的邮箱收发 API,可通过 REST 创建、发送、接收与搜索邮件,实现双向对话。
BenchSpan
BenchSpan 支持 AI agent 基准并行运行,自动记录得分与失败并整理运行历史;按提交标签复现,减少失败重跑浪费的 token。
Lasso
Lasso 是面向电商团队的 AI 优先 PIM,可丰富商品属性与描述、处理供应商数据,并通过应用或 API 支持竞品监控。
Codex Plugins
使用 Codex Plugins 将技能、应用集成和 MCP 服务器打包成可复用工作流,扩展 Codex 访问 Gmail、Google Drive 与 Slack 等工具。
Wallie
Wallie 是一款开源 AI 直播框架,支持实时视觉、可配置人格、聊天互动、TTS 与头像输出,适合在 Twitch、YouTube 或 Kick 上打造 VTuber 风格或 AI 驱动直播。