UStackUStack
MiniMax-AI/cli icon

MiniMax-AI/cli

MiniMax-AI/cli é a ferramenta oficial de linha de comando da MiniMax AI Platform para gerar texto, imagens, vídeo, fala e música.

MiniMax-AI/cli

O que é MiniMax-AI/cli?

MiniMax-AI/cli é a interface oficial de linha de comando (CLI) da MiniMax AI Platform. Ela permite gerar e processar vários tipos de mídia — texto, imagens, vídeo, fala e música — diretamente de um fluxo de trabalho de agente, terminal ou pipeline de automação.

A CLI foi projetada para ser usada em ambientes de agentes (“de qualquer agente ou terminal”) e suporta regiões global e CN via endpoints de API diferentes.

Principais Recursos

  • Geração multimídia em uma única CLI: Gere texto, imagens, vídeo, fala (TTS) e música a partir de prompts e entradas na linha de comando.
  • Chat de texto com streaming e saída estruturada: Suporta chat multi-turno, streaming, prompts de sistema e saída JSON usando o comando mmx text chat.
  • Controles de geração de imagens: Crie imagens com configurações de proporção e geração em lote (--n), e salve os resultados em um diretório de saída.
  • Geração de vídeo assíncrona com rastreamento de progresso: Inicie tarefas de vídeo de forma assíncrona (--async) e baixe os resultados depois usando identificadores de tarefa/arquivo.
  • Síntese de fala com voz, velocidade e streaming: Gere TTS com mais de 30 vozes, ajuste a velocidade e transmita a saída de áudio para um player de mídia.
  • Recursos de geração de música: Produza músicas baseadas em letras, gere letras automáticas a partir de prompts (--lyrics-optimizer), crie faixas instrumentais e gere covers a partir de áudio de referência.
  • Visão e busca da linha de comando: Use mmx vision para descrever imagens e mmx search para busca na web, incluindo modo de saída JSON.
  • Autenticação e configuração de região: Faça login com uma chave de API e gerencie configurações de região (exemplo inclui definir região como cn).

Como Usar o MiniMax-AI/cli

  1. Instale a CLI.
    • Para agentes de IA (OpenClaw, Cursor, Claude Code etc.): adicione a habilidade com npx skills add MiniMax-AI/cli -y -g.
    • Para uso em terminal: instale globalmente com npm install -g mmx-cli.
  2. Autentique-se com sua chave de API do plano de token MiniMax:
    • mmx auth login --api-key sk-xxxxx
  3. Execute um comando de mídia. Por exemplo:
    • Texto: mmx text chat --message "What is MiniMax?"
    • Imagem: mmx image "A cat in a spacesuit"
    • Fala: mmx speech synthesize --text "Hello!" --out hello.mp3
    • Vídeo: mmx video generate --prompt "Ocean waves at sunset"
    • Música: mmx music generate --prompt "Upbeat pop" --lyrics "[verse] La da dee, sunny day"
  4. Use o modo JSON quando necessário: envie entrada por pipe (ex.: cat messages.json) para o comando de chat e solicite --output json.

Casos de Uso

  • Fluxos de trabalho de agentes (assistentes de codificação): Adicione esta CLI como uma “habilidade” a um agente de IA para que ele possa chamar comandos como mmx text chat, mmx image ou mmx video generate seguindo convenções de agentes.
  • Criação de conteúdo baseada em terminal: Gere imagens, fala ou música a partir de scripts sem construir uma UI separada (por exemplo, criando assets e salvando em um caminho de saída).
  • Respostas de texto em streaming para trabalho interativo: Use mmx text chat --stream para lidar com saída incremental em sessões de terminal quando quiser observar as respostas enquanto são geradas.
  • Pipelines de mídia assíncronas: Inicie uma tarefa de geração de vídeo com --async, depois recupere e baixe os resultados com mmx video task get --task-id ... e mmx video download --file-id ....
  • Transformação de mídia e covers de música: Gere faixas instrumentais ou crie versões cover a partir de um arquivo de áudio de referência usando mmx music cover com --audio-file ou --audio.

FAQ

  • Quais tipos de mídia a CLI pode gerar? O README lista suporte para texto, imagens, vídeo, fala (TTS) e música, além de visão (compreensão/descrição de imagens) e busca na web.

  • Como faço autenticação? Use mmx auth login --api-key sk-xxxxx. A CLI também oferece comandos como mmx auth status, mmx auth refresh e mmx auth logout.

  • Posso usar saída em streaming? Sim. O chat de texto inclui a opção --stream, e a síntese de fala suporta o modo --stream (exemplo envia saída para mpv -).

  • Como trabalho com saídas JSON para chat/busca? Os exemplos da CLI mostram --output json para comandos como chat de texto (incluindo envio de mensagens de arquivo/STDIN por pipe) e busca.

  • Há suporte para endpoints Global e CN? O projeto menciona “Suporte contínuo para Global (api.minimax.io) e CN (api.minimaxi.com)”, e inclui um comando de exemplo para definir a região como cn (mmx config set --key region --value cn).

Alternativas

  • Clientes HTTP API para a MiniMax Platform: Se preferir integração direta, chame os endpoints da plataforma a partir dos seus próprios scripts em vez de usar esta CLI. Isso oferece mais controle, mas exige gerenciar autenticação e lógica de requisição.
  • Outras CLIs de “ferramenta/habilidade” para agentes: Muitos agentes de IA suportam anexar ferramentas/habilidades; você poderia usar um conector de ferramenta diferente para geração de mídia via agente. A diferença está em como a ferramenta é exposta ao agente e como os comandos são invocados.
  • Geradores de mídia baseados em UI dedicada: Para fluxos não-desenvolvedores, ferramentas baseadas em navegador podem simplificar a interação de prompt-para-saída. Comparado a uma CLI, elas trocam flexibilidade de automação e scripts por uma interface guiada.