MiniMax-AI/cli
MiniMax-AI/cliはMiniMax AI Platform公式CLI。テキスト、画像、動画、音声、音楽をエージェント/ターミナルから生成。visionとweb検索も対応。
MiniMax-AI/cliとは?
MiniMax-AI/cliはMiniMax AI Platformの公式コマンドラインインターフェース(CLI)です。エージェントワークフロー、ターミナル、または自動化パイプラインから直接、テキスト、画像、動画、音声、音楽などの複数メディアタイプを生成・処理できます。
CLIは「任意のエージェントやターミナルから使用可能」に設計されており、異なるAPIエンドポイント経由でグローバルおよびCNリージョンをサポートします。
主な機能
- 1つのCLIでマルチモーダル生成: コマンドラインのプロンプトと入力からテキスト、画像、動画、音声 (TTS)、音楽を生成。
- ストリーミングと構造化出力付きテキストチャット:
mmx text chatコマンドでマルチターン会話、ストリーミング、システムプロンプト、JSON出力をサポート。 - 画像生成コントロール: アスペクト比設定とバッチ生成(
--n)で画像を作成し、出力ディレクトリに保存。 - 進捗追跡付き非同期動画生成: 動画ジョブを非同期(
--async)で開始し、タスク/ファイルIDで後から結果をダウンロード。 - 音声・速度・ストリーミング付き音声合成: 30種類以上の声でTTSを生成、速度調整、メディアプレーヤーへオーディオストリーミング。
- 音楽生成機能: 歌詞ベースの曲生成、プロンプトから自動歌詞生成(
--lyrics-optimizer)、インストゥルメンタルトラック作成、カバー生成(参照オーディオから)。 - コマンドラインからのビジョンと検索:
mmx visionで画像記述、mmx searchでウェブ検索(JSON出力モード含む)。 - 認証とリージョン設定: APIキーでログイン、リージョン設定管理(例:
cnに設定)。
MiniMax-AI/cliの使い方
- インストール。
- AIエージェント(OpenClaw、Cursor、Claude Codeなど):
npx skills add MiniMax-AI/cli -y -gでスキル追加。 - ターミナル用:
npm install -g mmx-cliでグローバルインストール。
- AIエージェント(OpenClaw、Cursor、Claude Codeなど):
- MiniMaxトークンプランAPIキーで認証:
mmx auth login --api-key sk-xxxxx
- メディアコマンド実行。例:
- テキスト:
mmx text chat --message "What is MiniMax?" - 画像:
mmx image "A cat in a spacesuit" - 音声:
mmx speech synthesize --text "Hello!" --out hello.mp3 - 動画:
mmx video generate --prompt "Ocean waves at sunset" - 音楽:
mmx music generate --prompt "Upbeat pop" --lyrics "[verse] La da dee, sunny day"
- テキスト:
- 必要に応じてJSONモード使用: 入力(例:
cat messages.json)をチャットコマンドにパイプし、--output jsonを指定。
ユースケース
- エージェントワークフロー(コーディングアシスタント): AIエージェントにCLIを「スキル」として追加し、
mmx text chat、mmx image、mmx video generateなどのコマンドをエージェント規約に従って呼び出し。 - ターミナルベースのコンテンツ作成: 別UI構築なしでスクリプトから画像、音声、音楽を生成(例: アセット作成と出力パス保存)。
- インタラクティブ作業向けストリーミングテキスト応答:
mmx text chat --streamでターミナルセッションの逐次出力を観察。 - 非同期メディアパイプライン:
--asyncで動画生成開始、後でmmx video task get --task-id ...とmmx video download --file-id ...で取得・ダウンロード。 - メディア変換と音楽カバー:
mmx music coverで--audio-fileまたは--audioを使い、インストゥルメンタルトラックや参照オーディオからのカバー生成。
FAQ
-
CLIで生成可能なメディアタイプは? READMEにテキスト、画像、動画、音声 (TTS)、音楽のサポート記載、加えてビジョン(画像理解/記述)とウェブ検索。
-
認証方法は?
mmx auth login --api-key sk-xxxxxを使用。CLIにmmx auth status、mmx auth refresh、mmx auth logoutコマンドあり。 -
ストリーミング出力は使用可能? はい。テキストチャットに
--streamオプション、音声合成に--streamモード(例: 出力mpv -へパイプ)。 -
チャット/検索のJSON出力の扱い方は? CLI例にテキストチャット(ファイル/STDINからのメッセージパイプ含む)や検索で
--output json記載。 -
グローバルとCNエンドポイント両方対応? プロジェクトに「グローバル (api.minimax.io) とCN (api.minimaxi.com) のシームレスサポート」記載、例:
mmx config set --key region --value cnでリージョンcn設定。
代替手段
- MiniMax Platform向けHTTP APIクライアント: 直接統合を好む場合、CLIを使わず独自スクリプトからプラットフォームエンドポイント呼び出し。制御性向上だが認証とリクエストロジック必要。
- 他のエージェント「ツール/スキル」CLI: 多くのAIエージェントがツール/スキル接続対応。他のツールコネクタでエージェント駆動メディア生成可能。違いはツールのエージェント露出とコマンド呼び出し方法。
- 専用UIメディアジェネレータ: 非開発者向けにブラウザツールがプロンプト-出力操作簡素化。CLI比で自動化/スクリプト柔軟性をガイド付きインターフェースとトレード。
代替品
紫东太初
中国科学院自動化研究所と武漢人工知能研究院が共同で発表した新世代のマルチモーダル大規模モデルで、複数回のQ&A、テキスト作成、画像生成などの包括的なQ&Aタスクをサポートします。
PXZ AI
画像、動画、音声、ライティング、チャットのツールを統合したオールインワンAIプラットフォームで、創造性とコラボレーションを高めます。
Slidesgo
Slidesgoで無料のGoogleスライド用テーマとPowerPointテンプレートを検索・ダウンロード。オンラインでカスタマイズして作成に活用。
Grok AI Assistant
GrokはxAIによって開発された無料のAIアシスタントであり、真実性と客観性を優先するように設計されており、リアルタイム情報アクセスや画像生成などの高度な機能を提供します。
AakarDev AI
AakarDev AIは、シームレスなベクターデータベース統合を通じてAIアプリケーションの開発を簡素化し、迅速な展開とスケーラビリティを実現する強力なプラットフォームです。
Oli: Pregnancy Safety Scanner
Oli: Pregnancy Safety Scannerで、食品・スキンケア・サプリなどをバーコード/写真から妊娠中の安全性を確認。妊娠週数に合わせた評価。