UStackUStack
MiniMax-AI/cli icon

MiniMax-AI/cli

MiniMax-AI/cli est le CLI officiel de la plateforme MiniMax AI pour générer du texte, des images, la vidéo, la voix et la musique, avec vision et recherche web.

MiniMax-AI/cli

Qu'est-ce que MiniMax-AI/cli ?

MiniMax-AI/cli est l'interface en ligne de commande (CLI) officielle de la plateforme MiniMax AI. Elle permet de générer et traiter plusieurs types de médias — texte, images, vidéo, voix et musique — directement depuis un flux d'agents, un terminal ou un pipeline d'automatisation.

La CLI est conçue pour être utilisable dans divers environnements d'agents (« depuis n'importe quel agent ou terminal ») et prend en charge les régions globale et CN via différents points d'accès API.

Fonctionnalités principales

  • Génération multimodale en une seule CLI : Générez texte, images, vidéo, voix (TTS) et musique à partir de prompts et entrées en ligne de commande.
  • Chat texte avec streaming et sortie structurée : Prend en charge le chat multi-tour, le streaming, les prompts système et la sortie JSON via la commande mmx text chat.
  • Contrôles de génération d'images : Créez des images avec des réglages de ratio d'aspect et de génération par lots (--n), et enregistrez les résultats dans un répertoire de sortie.
  • Génération vidéo asynchrone avec suivi de progression : Lancez des tâches vidéo de manière asynchrone (--async) et téléchargez les résultats ultérieurement via des identifiants de tâches/fichiers.
  • Synthèse vocale avec voix, vitesse et streaming : Générez du TTS avec plus de 30 voix, ajustez la vitesse et streamez la sortie audio vers un lecteur multimédia.
  • Fonctionnalités de génération musicale : Produisez des chansons basées sur des paroles, générez des paroles automatiques à partir de prompts (--lyrics-optimizer), créez des pistes instrumentales et générez des covers à partir d'un audio de référence.
  • Vision et recherche depuis la ligne de commande : Utilisez mmx vision pour décrire des images et mmx search pour la recherche web, y compris en mode sortie JSON.
  • Authentification et configuration de région : Connectez-vous avec une clé API et gérez les paramètres de région (exemple : définir la région sur cn).

Comment utiliser MiniMax-AI/cli

  1. Installez la CLI.
    • Pour les agents IA (OpenClaw, Cursor, Claude Code, etc.) : ajoutez la compétence via npx skills add MiniMax-AI/cli -y -g.
    • Pour un usage en terminal : installez globalement avec npm install -g mmx-cli.
  2. Authentifiez-vous avec votre clé API du plan token MiniMax :
    • mmx auth login --api-key sk-xxxxx
  3. Exécutez une commande média. Par exemple :
    • Texte : mmx text chat --message "What is MiniMax?"
    • Image : mmx image "A cat in a spacesuit"
    • Voix : mmx speech synthesize --text "Hello!" --out hello.mp3
    • Vidéo : mmx video generate --prompt "Ocean waves at sunset"
    • Musique : mmx music generate --prompt "Upbeat pop" --lyrics "[verse] La da dee, sunny day"
  4. Utilisez le mode JSON si nécessaire : pipez une entrée (ex. cat messages.json) dans la commande de chat et demandez --output json.

Cas d'usage

  • Flux d'agents (assistants de codage) : Ajoutez cette CLI comme une « compétence » à un agent IA pour qu'il puisse appeler des commandes comme mmx text chat, mmx image ou mmx video generate tout en respectant les conventions de l'agent.
  • Création de contenu en terminal : Générez des images, de la voix ou de la musique à partir de scripts sans construire d'UI séparée (par exemple, créer des assets et les sauvegarder dans un chemin de sortie).
  • Réponses texte en streaming pour un travail interactif : Utilisez mmx text chat --stream pour gérer une sortie incrémentale dans des sessions terminal quand vous voulez observer les réponses au fur et à mesure.
  • Pipelines média asynchrones : Lancez une tâche de génération vidéo avec --async, puis récupérez et téléchargez les résultats plus tard via mmx video task get --task-id ... et mmx video download --file-id ....
  • Transformation média et covers musicaux : Générez des pistes instrumentales ou créez des versions cover à partir d'un fichier audio de référence avec mmx music cover et --audio-file ou --audio.

FAQ

  • Quels types de médias la CLI peut-elle générer ? Le README liste le support pour texte, images, vidéo, voix (TTS) et musique, plus vision (compréhension/description d'images) et recherche web.

  • Comment m'authentifier ? Utilisez mmx auth login --api-key sk-xxxxx. La CLI propose aussi des commandes comme mmx auth status, mmx auth refresh et mmx auth logout.

  • Puis-je utiliser la sortie en streaming ? Oui. Le chat texte inclut l'option --stream, et la synthèse vocale prend en charge un mode --stream (exemple : pipe la sortie vers mpv -).

  • Comment travailler avec les sorties JSON pour chat/recherche ? Les exemples CLI montrent --output json pour des commandes comme le chat texte (y compris le pipe de messages depuis un fichier/STDIN) et pour la recherche.

  • Y a-t-il un support pour les endpoints Global et CN ? Le projet note un « support fluide Global (api.minimax.io) et CN (api.minimaxi.com) », avec un exemple de commande pour définir la région sur cn (mmx config set --key region --value cn).

Alternatives

  • Clients HTTP API pour la plateforme MiniMax : Si vous préférez une intégration directe, vous pouvez appeler les endpoints de la plateforme depuis vos propres scripts au lieu d'utiliser cette CLI. Cela offre plus de contrôle mais nécessite de gérer l'authentification et la logique de requête.
  • Autres CLI « outil/compétence » pour agents : De nombreux agents IA supportent l'attache d'outils/compétences ; vous pourriez utiliser un autre connecteur d'outil pour la génération média pilotée par agent. La différence réside dans la façon dont l'outil est exposé à l'agent et les commandes invoquées.
  • Générateurs média avec UI dédiée : Pour des flux non-développeurs, des outils basés sur navigateur peuvent simplifier l'interaction prompt-vers-sortie. Par rapport à une CLI, ils échangent généralement la flexibilité d'automatisation et de script contre une interface guidée.