UStackUStack
MiniMax-AI/cli icon

MiniMax-AI/cli

MiniMax-AI/cli 官方命令行工具,可从代理或终端生成/处理文本、图像、视频、语音、音乐,并支持视觉与网页搜索。

MiniMax-AI/cli

什么是 MiniMax-AI/cli?

MiniMax-AI/cli 是 MiniMax AI 平台的官方命令行界面 (CLI)。它允许您直接从代理工作流、终端或自动化管道生成和处理多种媒体类型——文本、图像、视频、语音和音乐。

CLI 设计用于跨代理环境使用(“从任意代理或终端”),并通过不同 API 端点支持全球和 CN 区域。

主要特性

  • 一站式多模态生成:从命令行提示和输入生成 文本图像视频语音 (TTS)音乐
  • 支持流式和结构化输出的文本聊天:使用 mmx text chat 命令支持 多轮聊天流式输出系统提示JSON 输出
  • 图像生成控制:创建图像时设置 宽高比批量生成 (--n),并将结果保存到输出目录。
  • 异步视频生成与进度跟踪:异步启动视频任务 (--async),随后使用任务/文件 ID 下载结果。
  • 语音合成支持声音、速度和流式:使用 30+ 种声音 生成 TTS,调整 速度,并将音频输出流式传输到媒体播放器。
  • 音乐生成功能:生成 基于歌词 的歌曲,从提示自动生成 歌词 (--lyrics-optimizer),创建 纯音乐 曲目,并从参考音频 生成翻唱
  • 命令行视觉与搜索:使用 mmx vision 描述图像,mmx search 进行网页搜索,支持 JSON 输出模式。
  • 认证与区域配置:使用 API 密钥登录,并管理区域设置(示例包括将区域设置为 cn)。

如何使用 MiniMax-AI/cli

  1. 安装 CLI。
    • 对于 AI 代理 (OpenClaw、Cursor、Claude Code 等):使用 npx skills add MiniMax-AI/cli -y -g 添加技能。
    • 对于终端使用:全局安装 npm install -g mmx-cli
  2. 使用 MiniMax 令牌计划 API 密钥认证
    • mmx auth login --api-key sk-xxxxx
  3. 运行媒体命令。例如:
    • 文本:mmx text chat --message "What is MiniMax?"
    • 图像:mmx image "A cat in a spacesuit"
    • 语音:mmx speech synthesize --text "Hello!" --out hello.mp3
    • 视频:mmx video generate --prompt "Ocean waves at sunset"
    • 音乐:mmx music generate --prompt "Upbeat pop" --lyrics "[verse] La da dee, sunny day"
  4. 需要时使用 JSON 模式:将输入管道化(例如 cat messages.json)到聊天命令,并请求 --output json

使用场景

  • 代理工作流(编码助手):将此 CLI 添加为 AI 代理的“技能”,使代理能够调用如 mmx text chatmmx imagemmx video generate 等命令,同时遵循代理约定。
  • 基于终端的内容创建:从脚本生成图像、语音或音乐,而无需构建单独 UI(例如创建资产生成并保存到输出路径)。
  • 交互式工作的流式文本响应:使用 mmx text chat --stream 在终端会话中处理增量输出,以便观察生成中的响应。
  • 异步媒体管道:使用 --async 启动视频生成任务,随后使用 mmx video task get --task-id ...mmx video download --file-id ... 检索并下载结果。
  • 媒体转换与音乐翻唱:使用 mmx music cover 配合 --audio-file--audio 生成纯音乐曲目或从参考音频文件创建翻唱版本。

常见问题

  • CLI 支持生成哪些媒体类型? README 列出了对 文本图像视频语音 (TTS)音乐 的支持,还包括 视觉(图像理解/描述)和 网页搜索

  • 如何认证? 使用 mmx auth login --api-key sk-xxxxx。CLI 还提供 mmx auth statusmmx auth refreshmmx auth logout 等命令。

  • 是否支持流式输出? 是的。文本聊天包含 --stream 选项,语音合成支持 --stream 模式(示例将输出管道化到 mpv -)。

  • 如何处理聊天/搜索的 JSON 输出? CLI 示例显示了文本聊天(包括从文件/STDIN 管道化消息)和搜索命令的 --output json

  • 是否支持全球和 CN 端点? 项目注明“无缝支持全球 (api.minimax.io) 和 CN (api.minimaxi.com)”,并包含将区域设置为 cn 的示例命令 (mmx config set --key region --value cn)。

替代方案

  • MiniMax 平台的 HTTP API 客户端:如果您偏好直接集成,可以从自己的脚本调用平台端点,而非使用此 CLI。这提供更多控制,但需要处理认证和请求逻辑。
  • 其他代理“工具/技能” CLI:许多 AI 代理支持附加工具/技能;您可以使用不同的工具连接器进行代理驱动的媒体生成。区别在于工具如何向代理呈现以及命令如何调用。
  • 专用基于 UI 的媒体生成器:对于非开发者工作流,基于浏览器的工具可能简化提示到输出的交互。与 CLI 相比,它们通常以引导式界面换取自动化和脚本灵活性。