MiniMax-AI/cli
MiniMax-AI/cli est le CLI officiel de la plateforme MiniMax AI pour générer du texte, des images, la vidéo, la voix et la musique, avec vision et recherche web.
Qu'est-ce que MiniMax-AI/cli ?
MiniMax-AI/cli est l'interface en ligne de commande (CLI) officielle de la plateforme MiniMax AI. Elle permet de générer et traiter plusieurs types de médias — texte, images, vidéo, voix et musique — directement depuis un flux d'agents, un terminal ou un pipeline d'automatisation.
La CLI est conçue pour être utilisable dans divers environnements d'agents (« depuis n'importe quel agent ou terminal ») et prend en charge les régions globale et CN via différents points d'accès API.
Fonctionnalités principales
- Génération multimodale en une seule CLI : Générez texte, images, vidéo, voix (TTS) et musique à partir de prompts et entrées en ligne de commande.
- Chat texte avec streaming et sortie structurée : Prend en charge le chat multi-tour, le streaming, les prompts système et la sortie JSON via la commande
mmx text chat. - Contrôles de génération d'images : Créez des images avec des réglages de ratio d'aspect et de génération par lots (
--n), et enregistrez les résultats dans un répertoire de sortie. - Génération vidéo asynchrone avec suivi de progression : Lancez des tâches vidéo de manière asynchrone (
--async) et téléchargez les résultats ultérieurement via des identifiants de tâches/fichiers. - Synthèse vocale avec voix, vitesse et streaming : Générez du TTS avec plus de 30 voix, ajustez la vitesse et streamez la sortie audio vers un lecteur multimédia.
- Fonctionnalités de génération musicale : Produisez des chansons basées sur des paroles, générez des paroles automatiques à partir de prompts (
--lyrics-optimizer), créez des pistes instrumentales et générez des covers à partir d'un audio de référence. - Vision et recherche depuis la ligne de commande : Utilisez
mmx visionpour décrire des images etmmx searchpour la recherche web, y compris en mode sortie JSON. - Authentification et configuration de région : Connectez-vous avec une clé API et gérez les paramètres de région (exemple : définir la région sur
cn).
Comment utiliser MiniMax-AI/cli
- Installez la CLI.
- Pour les agents IA (OpenClaw, Cursor, Claude Code, etc.) : ajoutez la compétence via
npx skills add MiniMax-AI/cli -y -g. - Pour un usage en terminal : installez globalement avec
npm install -g mmx-cli.
- Pour les agents IA (OpenClaw, Cursor, Claude Code, etc.) : ajoutez la compétence via
- Authentifiez-vous avec votre clé API du plan token MiniMax :
mmx auth login --api-key sk-xxxxx
- Exécutez une commande média. Par exemple :
- Texte :
mmx text chat --message "What is MiniMax?" - Image :
mmx image "A cat in a spacesuit" - Voix :
mmx speech synthesize --text "Hello!" --out hello.mp3 - Vidéo :
mmx video generate --prompt "Ocean waves at sunset" - Musique :
mmx music generate --prompt "Upbeat pop" --lyrics "[verse] La da dee, sunny day"
- Texte :
- Utilisez le mode JSON si nécessaire : pipez une entrée (ex.
cat messages.json) dans la commande de chat et demandez--output json.
Cas d'usage
- Flux d'agents (assistants de codage) : Ajoutez cette CLI comme une « compétence » à un agent IA pour qu'il puisse appeler des commandes comme
mmx text chat,mmx imageoummx video generatetout en respectant les conventions de l'agent. - Création de contenu en terminal : Générez des images, de la voix ou de la musique à partir de scripts sans construire d'UI séparée (par exemple, créer des assets et les sauvegarder dans un chemin de sortie).
- Réponses texte en streaming pour un travail interactif : Utilisez
mmx text chat --streampour gérer une sortie incrémentale dans des sessions terminal quand vous voulez observer les réponses au fur et à mesure. - Pipelines média asynchrones : Lancez une tâche de génération vidéo avec
--async, puis récupérez et téléchargez les résultats plus tard viammx video task get --task-id ...etmmx video download --file-id .... - Transformation média et covers musicaux : Générez des pistes instrumentales ou créez des versions cover à partir d'un fichier audio de référence avec
mmx music coveret--audio-fileou--audio.
FAQ
-
Quels types de médias la CLI peut-elle générer ? Le README liste le support pour texte, images, vidéo, voix (TTS) et musique, plus vision (compréhension/description d'images) et recherche web.
-
Comment m'authentifier ? Utilisez
mmx auth login --api-key sk-xxxxx. La CLI propose aussi des commandes commemmx auth status,mmx auth refreshetmmx auth logout. -
Puis-je utiliser la sortie en streaming ? Oui. Le chat texte inclut l'option
--stream, et la synthèse vocale prend en charge un mode--stream(exemple : pipe la sortie versmpv -). -
Comment travailler avec les sorties JSON pour chat/recherche ? Les exemples CLI montrent
--output jsonpour des commandes comme le chat texte (y compris le pipe de messages depuis un fichier/STDIN) et pour la recherche. -
Y a-t-il un support pour les endpoints Global et CN ? Le projet note un « support fluide Global (api.minimax.io) et CN (api.minimaxi.com) », avec un exemple de commande pour définir la région sur
cn(mmx config set --key region --value cn).
Alternatives
- Clients HTTP API pour la plateforme MiniMax : Si vous préférez une intégration directe, vous pouvez appeler les endpoints de la plateforme depuis vos propres scripts au lieu d'utiliser cette CLI. Cela offre plus de contrôle mais nécessite de gérer l'authentification et la logique de requête.
- Autres CLI « outil/compétence » pour agents : De nombreux agents IA supportent l'attache d'outils/compétences ; vous pourriez utiliser un autre connecteur d'outil pour la génération média pilotée par agent. La différence réside dans la façon dont l'outil est exposé à l'agent et les commandes invoquées.
- Générateurs média avec UI dédiée : Pour des flux non-développeurs, des outils basés sur navigateur peuvent simplifier l'interaction prompt-vers-sortie. Par rapport à une CLI, ils échangent généralement la flexibilité d'automatisation et de script contre une interface guidée.
Alternatives
紫东太初
Un nouveau modèle multimodal de grande taille de nouvelle génération lancé par l'Institut d'automatisation de l'Académie chinoise des sciences et l'Institut de recherche en intelligence artificielle de Wuhan, prenant en charge des questions-réponses en plusieurs tours, la création de texte, la génération d'images et des tâches de questions-réponses complètes.
PXZ AI
Une plateforme IA tout-en-un qui combine des outils pour l'image, la vidéo, la voix, l'écriture et le chat afin d'améliorer la créativité et la collaboration.
Slidesgo
Découvrez des modèles et thèmes gratuits Google Slides et PowerPoint sur Slidesgo : téléchargez, personnalisez en ligne et créez vos présentations.
Grok AI Assistant
Grok est un assistant IA gratuit développé par xAI, conçu pour privilégier la vérité et l'objectivité tout en offrant des capacités avancées telles que l'accès à l'information en temps réel et la génération d'images.
AakarDev AI
AakarDev AI est une plateforme puissante qui simplifie le développement d'applications d'IA avec une intégration fluide des bases de données vectorielles, permettant un déploiement rapide et une évolutivité.
Oli: Pregnancy Safety Scanner
Oli : Pregnancy Safety Scanner vous aide à vérifier la sécurité des aliments, soins, compléments et produits pendant la grossesse via scan photo/code-barres.