什么是 MiniMax-AI/cli?
MiniMax-AI/cli 是 MiniMax AI 平台的官方命令行界面 (CLI)。它允许您直接从代理工作流、终端或自动化管道生成和处理多种媒体类型——文本、图像、视频、语音和音乐。
CLI 设计用于跨代理环境使用(“从任意代理或终端”),并通过不同 API 端点支持全球和 CN 区域。
主要特性
- 一站式多模态生成:从命令行提示和输入生成 文本、图像、视频、语音 (TTS) 和 音乐。
- 支持流式和结构化输出的文本聊天:使用
mmx text chat命令支持 多轮聊天、流式输出、系统提示 和 JSON 输出。 - 图像生成控制:创建图像时设置 宽高比 和 批量生成 (
--n),并将结果保存到输出目录。 - 异步视频生成与进度跟踪:异步启动视频任务 (
--async),随后使用任务/文件 ID 下载结果。 - 语音合成支持声音、速度和流式:使用 30+ 种声音 生成 TTS,调整 速度,并将音频输出流式传输到媒体播放器。
- 音乐生成功能:生成 基于歌词 的歌曲,从提示自动生成 歌词 (
--lyrics-optimizer),创建 纯音乐 曲目,并从参考音频 生成翻唱。 - 命令行视觉与搜索:使用
mmx vision描述图像,mmx search进行网页搜索,支持 JSON 输出模式。 - 认证与区域配置:使用 API 密钥登录,并管理区域设置(示例包括将区域设置为
cn)。
如何使用 MiniMax-AI/cli
- 安装 CLI。
- 对于 AI 代理 (OpenClaw、Cursor、Claude Code 等):使用
npx skills add MiniMax-AI/cli -y -g添加技能。 - 对于终端使用:全局安装
npm install -g mmx-cli。
- 对于 AI 代理 (OpenClaw、Cursor、Claude Code 等):使用
- 使用 MiniMax 令牌计划 API 密钥认证:
mmx auth login --api-key sk-xxxxx
- 运行媒体命令。例如:
- 文本:
mmx text chat --message "What is MiniMax?" - 图像:
mmx image "A cat in a spacesuit" - 语音:
mmx speech synthesize --text "Hello!" --out hello.mp3 - 视频:
mmx video generate --prompt "Ocean waves at sunset" - 音乐:
mmx music generate --prompt "Upbeat pop" --lyrics "[verse] La da dee, sunny day"
- 文本:
- 需要时使用 JSON 模式:将输入管道化(例如
cat messages.json)到聊天命令,并请求--output json。
使用场景
- 代理工作流(编码助手):将此 CLI 添加为 AI 代理的“技能”,使代理能够调用如
mmx text chat、mmx image或mmx video generate等命令,同时遵循代理约定。 - 基于终端的内容创建:从脚本生成图像、语音或音乐,而无需构建单独 UI(例如创建资产生成并保存到输出路径)。
- 交互式工作的流式文本响应:使用
mmx text chat --stream在终端会话中处理增量输出,以便观察生成中的响应。 - 异步媒体管道:使用
--async启动视频生成任务,随后使用mmx video task get --task-id ...和mmx video download --file-id ...检索并下载结果。 - 媒体转换与音乐翻唱:使用
mmx music cover配合--audio-file或--audio生成纯音乐曲目或从参考音频文件创建翻唱版本。
常见问题
-
CLI 支持生成哪些媒体类型? README 列出了对 文本、图像、视频、语音 (TTS) 和 音乐 的支持,还包括 视觉(图像理解/描述)和 网页搜索。
-
如何认证? 使用
mmx auth login --api-key sk-xxxxx。CLI 还提供mmx auth status、mmx auth refresh和mmx auth logout等命令。 -
是否支持流式输出? 是的。文本聊天包含
--stream选项,语音合成支持--stream模式(示例将输出管道化到mpv -)。 -
如何处理聊天/搜索的 JSON 输出? CLI 示例显示了文本聊天(包括从文件/STDIN 管道化消息)和搜索命令的
--output json。 -
是否支持全球和 CN 端点? 项目注明“无缝支持全球 (api.minimax.io) 和 CN (api.minimaxi.com)”,并包含将区域设置为
cn的示例命令 (mmx config set --key region --value cn)。
替代方案
- MiniMax 平台的 HTTP API 客户端:如果您偏好直接集成,可以从自己的脚本调用平台端点,而非使用此 CLI。这提供更多控制,但需要处理认证和请求逻辑。
- 其他代理“工具/技能” CLI:许多 AI 代理支持附加工具/技能;您可以使用不同的工具连接器进行代理驱动的媒体生成。区别在于工具如何向代理呈现以及命令如何调用。
- 专用基于 UI 的媒体生成器:对于非开发者工作流,基于浏览器的工具可能简化提示到输出的交互。与 CLI 相比,它们通常以引导式界面换取自动化和脚本灵活性。
替代品
紫东太初
中国科学院自动化研究所和武汉人工智能研究院推出的新一代多模态大模型,支持多轮问答、文本创作、图像生成等全面问答任务。
PXZ AI
一个集成图像、视频、语音、写作和聊天工具的全能AI平台,以增强创造力和协作。
Slidesgo
探索 Slidesgo 上免费的 Google 幻灯片主题与 PowerPoint 模板,下载并在线自定义,使用模板快速制作演示。
Grok AI Assistant
Grok 是 xAI 开发的一款免费人工智能助手,旨在优先考虑真实性和客观性,同时提供实时信息访问和图像生成等高级功能。
AakarDev AI
AakarDev AI 是一个强大的平台,通过无缝的向量数据库集成简化 AI 应用程序的开发,实现快速部署和可扩展性。
Oli: Pregnancy Safety Scanner
Oli: Pregnancy Safety Scanner 帮你用条码/拍照扫描与孕期分期评分,快速判断食品、护肤品与补充剂是否适合怀孕。