MiniMax-AI/cli 是什麼?
MiniMax-AI/cli 是 MiniMax AI 平台的官方命令列介面 (CLI)。它讓您可以直接從代理工作流程、終端機或自動化管線生成與處理多種媒體類型—文字、影像、影片、語音與音樂。
CLI 設計適用於各種代理環境(「從任何代理或終端機」),並透過不同 API 端點支援全球與中國地區。
主要功能
- 單一 CLI 多模態生成:從命令列提示與輸入生成 文字、影像、影片、語音 (TTS) 與 音樂。
- 支援串流與結構化輸出的文字聊天:使用
mmx text chat指令支援 多輪對話、串流、系統提示 與 JSON 輸出。 - 影像生成控制:以 長寬比 設定與 批次生成 (
--n) 建立影像,並將結果儲存至輸出目錄。 - 非同步影片生成與進度追蹤:以
--async非同步啟動影片任務,之後使用任務/檔案識別碼下載結果。 - 語音合成支援聲音、速度與串流:以 30+ 種聲音 生成 TTS、調整 速度,並串流音訊輸出至媒體播放器。
- 音樂生成功能:產生 基於歌詞 的歌曲、從提示生成 自動歌詞 (
--lyrics-optimizer)、建立 純音樂 曲目,並從參考音訊 生成翻唱。 - 命令列視覺與搜尋:使用
mmx vision描述影像,mmx search進行網頁搜尋,包含 JSON 輸出模式。 - 認證與地區設定:以 API 金鑰登入,並管理地區設定(範例包含將地區設為
cn)。
如何使用 MiniMax-AI/cli
- 安裝 CLI。
- 適用於 AI 代理 (OpenClaw、Cursor、Claude Code 等):使用
npx skills add MiniMax-AI/cli -y -g新增技能。 - 終端機使用:以
npm install -g mmx-cli全域安裝。
- 適用於 AI 代理 (OpenClaw、Cursor、Claude Code 等):使用
- 以 MiniMax 權杖方案 API 金鑰認證:
mmx auth login --api-key sk-xxxxx
- 執行媒體指令。範例:
- 文字:
mmx text chat --message "What is MiniMax?" - 影像:
mmx image "A cat in a spacesuit" - 語音:
mmx speech synthesize --text "Hello!" --out hello.mp3 - 影片:
mmx video generate --prompt "Ocean waves at sunset" - 音樂:
mmx music generate --prompt "Upbeat pop" --lyrics "[verse] La da dee, sunny day"
- 文字:
- 必要時使用 JSON 模式:將輸入導向 (例如
cat messages.json) 至聊天指令,並要求--output json。
使用情境
- 代理工作流程 (程式碼助理):將此 CLI 新增為 AI 代理的「技能」,讓代理可依代理慣例呼叫如
mmx text chat、mmx image或mmx video generate等指令。 - 基於終端機的內容建立:從腳本生成影像、語音或音樂,無需建立獨立 UI(例如建立資產並儲存至輸出路徑)。
- 互動工作中的串流文字回應:使用
mmx text chat --stream在終端工作階段處理增量輸出,以便觀察生成中的回應。 - 非同步媒體管線:以
--async啟動影片生成任務,之後使用mmx video task get --task-id ...與mmx video download --file-id ...擷取與下載結果。 - 媒體轉換與音樂翻唱:使用
mmx music cover以--audio-file或--audio從參考音訊檔案生成純音樂曲目或翻唱版本。
常見問題
-
CLI 可生成哪些媒體類型? README 列出支援 文字、影像、影片、語音 (TTS) 與 音樂,另加 視覺 (影像理解/描述) 與 網頁搜尋。
-
如何認證? 使用
mmx auth login --api-key sk-xxxxx。CLI 也提供如mmx auth status、mmx auth refresh與mmx auth logout等指令。 -
可使用串流輸出嗎? 可以。文字聊天包含
--stream選項,語音合成支援--stream模式(範例將輸出導向mpv -)。 -
如何處理聊天/搜尋的 JSON 輸出? CLI 範例顯示文字聊天 (包含從檔案/STDIN 導入訊息) 與搜尋等指令使用
--output json。 -
是否支援全球與中國端點? 專案註明「無縫支援全球 (api.minimax.io) 與中國 (api.minimaxi.com)」,並包含將地區設為
cn的範例指令 (mmx config set --key region --value cn)。
替代方案
- MiniMax 平台的 HTTP API 客戶端:若偏好直接整合,可從自家腳本呼叫平台端點,而非使用此 CLI。此方式提供更多控制,但需自行處理認證與請求邏輯。
- 其他代理「工具/技能」CLI:許多 AI 代理支援附加工具/技能;您可使用不同工具連接器進行代理驅動的媒體生成。差異在於工具如何呈現給代理與指令呼叫方式。
- 專用 UI 媒體生成器:適用非開發者工作流程,基於瀏覽器的工具可簡化提示至輸出的互動。相較 CLI,它們通常以導引式介面交換自動化與腳本彈性。
替代品
紫东太初
中國科學院自動化研究所和武漢人工智慧研究院推出的新一代多模態大模型,支持多輪問答、文本創作、圖像生成等全面問答任務。
PXZ AI
一個集成圖像、視頻、語音、寫作和聊天工具的全能AI平台,以增強創造力和協作。
Slidesgo
在 Slidesgo 下載免費 Google Slides 主題與 PowerPoint 模板,線上自訂並使用模板快速製作簡報。
Grok AI Assistant
Grok 是由 xAI 開發的一款免費 AI 助理,旨在優先考慮真實性和客觀性,同時提供即時資訊存取和圖像生成等進階功能。
AakarDev AI
AakarDev AI 是一個強大的平台,通過無縫的向量資料庫整合簡化 AI 應用程式的開發,實現快速部署和可擴展性。
Oli: Pregnancy Safety Scanner
Oli: Pregnancy Safety Scanner 透過條碼/照片掃描與孕期分期評分,快速判斷食物、保養品、保健品等是否適合懷孕。