MiniMax-AI/cli
MiniMax-AI/cli é a ferramenta oficial de linha de comando da MiniMax AI Platform para gerar texto, imagens, vídeo, fala e música.
O que é MiniMax-AI/cli?
MiniMax-AI/cli é a interface oficial de linha de comando (CLI) da MiniMax AI Platform. Ela permite gerar e processar vários tipos de mídia — texto, imagens, vídeo, fala e música — diretamente de um fluxo de trabalho de agente, terminal ou pipeline de automação.
A CLI foi projetada para ser usada em ambientes de agentes (“de qualquer agente ou terminal”) e suporta regiões global e CN via endpoints de API diferentes.
Principais Recursos
- Geração multimídia em uma única CLI: Gere texto, imagens, vídeo, fala (TTS) e música a partir de prompts e entradas na linha de comando.
- Chat de texto com streaming e saída estruturada: Suporta chat multi-turno, streaming, prompts de sistema e saída JSON usando o comando
mmx text chat. - Controles de geração de imagens: Crie imagens com configurações de proporção e geração em lote (
--n), e salve os resultados em um diretório de saída. - Geração de vídeo assíncrona com rastreamento de progresso: Inicie tarefas de vídeo de forma assíncrona (
--async) e baixe os resultados depois usando identificadores de tarefa/arquivo. - Síntese de fala com voz, velocidade e streaming: Gere TTS com mais de 30 vozes, ajuste a velocidade e transmita a saída de áudio para um player de mídia.
- Recursos de geração de música: Produza músicas baseadas em letras, gere letras automáticas a partir de prompts (
--lyrics-optimizer), crie faixas instrumentais e gere covers a partir de áudio de referência. - Visão e busca da linha de comando: Use
mmx visionpara descrever imagens emmx searchpara busca na web, incluindo modo de saída JSON. - Autenticação e configuração de região: Faça login com uma chave de API e gerencie configurações de região (exemplo inclui definir região como
cn).
Como Usar o MiniMax-AI/cli
- Instale a CLI.
- Para agentes de IA (OpenClaw, Cursor, Claude Code etc.): adicione a habilidade com
npx skills add MiniMax-AI/cli -y -g. - Para uso em terminal: instale globalmente com
npm install -g mmx-cli.
- Para agentes de IA (OpenClaw, Cursor, Claude Code etc.): adicione a habilidade com
- Autentique-se com sua chave de API do plano de token MiniMax:
mmx auth login --api-key sk-xxxxx
- Execute um comando de mídia. Por exemplo:
- Texto:
mmx text chat --message "What is MiniMax?" - Imagem:
mmx image "A cat in a spacesuit" - Fala:
mmx speech synthesize --text "Hello!" --out hello.mp3 - Vídeo:
mmx video generate --prompt "Ocean waves at sunset" - Música:
mmx music generate --prompt "Upbeat pop" --lyrics "[verse] La da dee, sunny day"
- Texto:
- Use o modo JSON quando necessário: envie entrada por pipe (ex.:
cat messages.json) para o comando de chat e solicite--output json.
Casos de Uso
- Fluxos de trabalho de agentes (assistentes de codificação): Adicione esta CLI como uma “habilidade” a um agente de IA para que ele possa chamar comandos como
mmx text chat,mmx imageoummx video generateseguindo convenções de agentes. - Criação de conteúdo baseada em terminal: Gere imagens, fala ou música a partir de scripts sem construir uma UI separada (por exemplo, criando assets e salvando em um caminho de saída).
- Respostas de texto em streaming para trabalho interativo: Use
mmx text chat --streampara lidar com saída incremental em sessões de terminal quando quiser observar as respostas enquanto são geradas. - Pipelines de mídia assíncronas: Inicie uma tarefa de geração de vídeo com
--async, depois recupere e baixe os resultados commmx video task get --task-id ...emmx video download --file-id .... - Transformação de mídia e covers de música: Gere faixas instrumentais ou crie versões cover a partir de um arquivo de áudio de referência usando
mmx music covercom--audio-fileou--audio.
FAQ
-
Quais tipos de mídia a CLI pode gerar? O README lista suporte para texto, imagens, vídeo, fala (TTS) e música, além de visão (compreensão/descrição de imagens) e busca na web.
-
Como faço autenticação? Use
mmx auth login --api-key sk-xxxxx. A CLI também oferece comandos comommx auth status,mmx auth refreshemmx auth logout. -
Posso usar saída em streaming? Sim. O chat de texto inclui a opção
--stream, e a síntese de fala suporta o modo--stream(exemplo envia saída parampv -). -
Como trabalho com saídas JSON para chat/busca? Os exemplos da CLI mostram
--output jsonpara comandos como chat de texto (incluindo envio de mensagens de arquivo/STDIN por pipe) e busca. -
Há suporte para endpoints Global e CN? O projeto menciona “Suporte contínuo para Global (api.minimax.io) e CN (api.minimaxi.com)”, e inclui um comando de exemplo para definir a região como
cn(mmx config set --key region --value cn).
Alternativas
- Clientes HTTP API para a MiniMax Platform: Se preferir integração direta, chame os endpoints da plataforma a partir dos seus próprios scripts em vez de usar esta CLI. Isso oferece mais controle, mas exige gerenciar autenticação e lógica de requisição.
- Outras CLIs de “ferramenta/habilidade” para agentes: Muitos agentes de IA suportam anexar ferramentas/habilidades; você poderia usar um conector de ferramenta diferente para geração de mídia via agente. A diferença está em como a ferramenta é exposta ao agente e como os comandos são invocados.
- Geradores de mídia baseados em UI dedicada: Para fluxos não-desenvolvedores, ferramentas baseadas em navegador podem simplificar a interação de prompt-para-saída. Comparado a uma CLI, elas trocam flexibilidade de automação e scripts por uma interface guiada.
Alternativas
紫东太初
Um novo modelo multimodal de grande porte da nova geração lançado pelo Instituto de Automação da Academia Chinesa de Ciências e pelo Instituto de Pesquisa em Inteligência Artificial de Wuhan, que suporta perguntas e respostas em múltiplas rodadas, criação de texto, geração de imagens e tarefas abrangentes de perguntas e respostas.
PXZ AI
Uma plataforma de IA tudo-em-um que combina ferramentas para imagem, vídeo, voz, escrita e chat para melhorar a criatividade e a colaboração.
Slidesgo
Descubra temas gratuitos do Google Slides e modelos do PowerPoint no Slidesgo. Baixe, personalize online e crie apresentações com modelos.
Grok AI Assistant
Grok é um assistente de IA gratuito desenvolvido pela xAI, projetado para priorizar a verdade e a objetividade, ao mesmo tempo que oferece capacidades avançadas como acesso a informações em tempo real e geração de imagens.
AakarDev AI
AakarDev AI é uma plataforma poderosa que simplifica o desenvolvimento de aplicações de IA com integração perfeita de banco de dados vetorial, permitindo implantação rápida e escalabilidade.
Oli: Pregnancy Safety Scanner
Oli: Pregnancy Safety Scanner ajuda a verificar se alimentos, cosméticos, suplementos e outros produtos são seguros na gravidez com scan por código/foto.