MiniMax M3

什么是 MiniMax M3？

MiniMax M3 是一款用于编程和 agent 任务的开源权重 AI 模型，支持原生多模态理解和超长上下文窗口。产品页将其定位为面向软件工程工作流、自主任务拆解、工具调用和多步推理的前沿模型。

M3 基于 MiniMax 自研的 Sparse Attention（MSA）架构构建，可通过 API 支持最高 1M token 的上下文窗口，并保证最低 512K token。根据来源，这种超长上下文旨在支持单次会话中的长程编程、长周期 agent 任务以及长视频理解。

该模型也被描述为原生多模态，在训练数据和数据流水线层面从一开始就重建，以对齐文本和视觉信息。页面将 M3 定位为面向需要兼顾编程性能、agent 执行能力和多模态输入处理的用户的开源替代方案。

通过 MSA 实现 1M-token 上下文窗口 — API 支持非常长的上下文窗口，且保证最低 512K token，适用于大型代码库、长流程工作和长文档。
聚焦编程与 agent 能力 — 模型被描述为在软件工程、终端执行、自主任务拆解、工具调用和多步推理方面表现强。
原生多模态理解 — M3 从一开始就使用多模态数据训练，而不是将视觉能力作为单独层加入，因此可同时处理文本与视觉输入。
开源权重可用 — 页面将 M3 描述为首个将前沿编程、百万 token 上下文和多模态能力结合起来的开源权重模型。
API 接入与开发者工具支持 — 页面提供了 API 示例，提到自动缓存支持，并说明兼容 AI 编程工具和 MiniMax Code。
长周期基准工作流 — 来源包含如自主论文复现、内核优化和多步训练工作流等示例，表明该模型面向长时、工具驱动任务。

用户通常通过 MiniMax API 或 MiniMax Code 等集成工具，以及其他 AI 编程工作流来访问 MiniMax M3。来源展示了一个 chat-completion 风格的 API 端点，并说明 API 版本支持自动缓存。

实际使用时，可以向模型发送任务提示，提供相关代码、文档或视觉输入，并让它在较长的工具调用流程中迭代处理。对于开发或 agent 任务团队，产品页还指出可通过 token 计划访问和开放平台集成，将模型接入现有工作流。

MiniMax M3 是开源权重吗？
是。页面将 M3 描述为开源权重模型。

上下文窗口有多大？
API 支持最高 1M token，且保证最低 512K token。

M3 支持多模态输入吗？
支持。页面说明 M3 具备原生多模态理解能力。

可以用于编程 agent 吗？
可以。来源强调了编程、agent 任务、自主拆解、工具使用和多步推理。

是否提到了本地部署？
提到了，但仅作为未来方向。页面说明 M3 不久后将完全开源到 HuggingFace 和 GitHub，并支持私有集群部署和微调。

闭源前沿模型 —— 页面在基准测试对比中引用了 Opus 4.7 和 GPT-5.5 等模型。对于比较顶级编程和 agent 性能的用户来说，这些是相关替代方案，但它们不是开源权重。
其他开源权重语言模型 —— 如果更看重自托管或本地控制，其他提供方的开源模型可能更接近，但它们未必能同时具备长上下文、编程和多模态能力。
专用编程助手 —— 主要专注于代码补全或 IDE 辅助的工具，可能更适合更简单的开发工作流；而 M3 的定位则更偏向更广泛的 agent 执行和长上下文推理。
不强调 agent 的多模态模型 —— 有些模型更侧重图像或文档理解，而不是工具使用和软件工程；如果主要需求是多模态分析而非自主执行，它们可能更合适。