UStackUStack
MiniMax-AI/cli icon

MiniMax-AI/cli

MiniMax-AI/cliはMiniMax AI Platform公式CLI。テキスト、画像、動画、音声、音楽をエージェント/ターミナルから生成。visionとweb検索も対応。

MiniMax-AI/cli

MiniMax-AI/cliとは?

MiniMax-AI/cliはMiniMax AI Platformの公式コマンドラインインターフェース(CLI)です。エージェントワークフロー、ターミナル、または自動化パイプラインから直接、テキスト、画像、動画、音声、音楽などの複数メディアタイプを生成・処理できます。

CLIは「任意のエージェントやターミナルから使用可能」に設計されており、異なるAPIエンドポイント経由でグローバルおよびCNリージョンをサポートします。

主な機能

  • 1つのCLIでマルチモーダル生成: コマンドラインのプロンプトと入力からテキスト画像動画音声 (TTS)音楽を生成。
  • ストリーミングと構造化出力付きテキストチャット: mmx text chatコマンドでマルチターン会話ストリーミングシステムプロンプトJSON出力をサポート。
  • 画像生成コントロール: アスペクト比設定とバッチ生成--n)で画像を作成し、出力ディレクトリに保存。
  • 進捗追跡付き非同期動画生成: 動画ジョブを非同期(--async)で開始し、タスク/ファイルIDで後から結果をダウンロード。
  • 音声・速度・ストリーミング付き音声合成: 30種類以上の声でTTSを生成、速度調整、メディアプレーヤーへオーディオストリーミング。
  • 音楽生成機能: 歌詞ベースの曲生成、プロンプトから自動歌詞生成(--lyrics-optimizer)、インストゥルメンタルトラック作成、カバー生成(参照オーディオから)。
  • コマンドラインからのビジョンと検索: mmx visionで画像記述、mmx searchでウェブ検索(JSON出力モード含む)。
  • 認証とリージョン設定: APIキーでログイン、リージョン設定管理(例: cnに設定)。

MiniMax-AI/cliの使い方

  1. インストール
    • AIエージェント(OpenClaw、Cursor、Claude Codeなど): npx skills add MiniMax-AI/cli -y -gでスキル追加。
    • ターミナル用: npm install -g mmx-cliでグローバルインストール。
  2. MiniMaxトークンプランAPIキーで認証:
    • mmx auth login --api-key sk-xxxxx
  3. メディアコマンド実行。例:
    • テキスト: mmx text chat --message "What is MiniMax?"
    • 画像: mmx image "A cat in a spacesuit"
    • 音声: mmx speech synthesize --text "Hello!" --out hello.mp3
    • 動画: mmx video generate --prompt "Ocean waves at sunset"
    • 音楽: mmx music generate --prompt "Upbeat pop" --lyrics "[verse] La da dee, sunny day"
  4. 必要に応じてJSONモード使用: 入力(例: cat messages.json)をチャットコマンドにパイプし、--output jsonを指定。

ユースケース

  • エージェントワークフロー(コーディングアシスタント): AIエージェントにCLIを「スキル」として追加し、mmx text chatmmx imagemmx video generateなどのコマンドをエージェント規約に従って呼び出し。
  • ターミナルベースのコンテンツ作成: 別UI構築なしでスクリプトから画像、音声、音楽を生成(例: アセット作成と出力パス保存)。
  • インタラクティブ作業向けストリーミングテキスト応答: mmx text chat --streamでターミナルセッションの逐次出力を観察。
  • 非同期メディアパイプライン: --asyncで動画生成開始、後でmmx video task get --task-id ...mmx video download --file-id ...で取得・ダウンロード。
  • メディア変換と音楽カバー: mmx music cover--audio-fileまたは--audioを使い、インストゥルメンタルトラックや参照オーディオからのカバー生成。

FAQ

  • CLIで生成可能なメディアタイプは? READMEにテキスト画像動画音声 (TTS)音楽のサポート記載、加えてビジョン(画像理解/記述)とウェブ検索

  • 認証方法は? mmx auth login --api-key sk-xxxxxを使用。CLIにmmx auth statusmmx auth refreshmmx auth logoutコマンドあり。

  • ストリーミング出力は使用可能? はい。テキストチャットに--streamオプション、音声合成に--streamモード(例: 出力mpv -へパイプ)。

  • チャット/検索のJSON出力の扱い方は? CLI例にテキストチャット(ファイル/STDINからのメッセージパイプ含む)や検索で--output json記載。

  • グローバルとCNエンドポイント両方対応? プロジェクトに「グローバル (api.minimax.io) とCN (api.minimaxi.com) のシームレスサポート」記載、例: mmx config set --key region --value cnでリージョンcn設定。

代替手段

  • MiniMax Platform向けHTTP APIクライアント: 直接統合を好む場合、CLIを使わず独自スクリプトからプラットフォームエンドポイント呼び出し。制御性向上だが認証とリクエストロジック必要。
  • 他のエージェント「ツール/スキル」CLI: 多くのAIエージェントがツール/スキル接続対応。他のツールコネクタでエージェント駆動メディア生成可能。違いはツールのエージェント露出とコマンド呼び出し方法。
  • 専用UIメディアジェネレータ: 非開発者向けにブラウザツールがプロンプト-出力操作簡素化。CLI比で自動化/スクリプト柔軟性をガイド付きインターフェースとトレード。