UStackUStack
MiniMax-AI/cli icon

MiniMax-AI/cli

MiniMax-AI/cli è lo strumento CLI ufficiale della MiniMax AI Platform per generare testo, immagini, video, speech e musica, con vision e web search.

MiniMax-AI/cli

Cos'è MiniMax-AI/cli?

MiniMax-AI/cli è l'interfaccia a riga di comando (CLI) ufficiale della MiniMax AI Platform. Ti permette di generare ed elaborare molteplici tipi di media—testo, immagini, video, speech e musica—direttamente da un workflow di agent, terminale o pipeline di automazione.

La CLI è progettata per essere utilizzabile in ambienti agent (“da qualsiasi agent o terminale”) e supporta sia le regioni globali che CN tramite endpoint API diversi.

Caratteristiche Principali

  • Generazione multi-modale in un'unica CLI: Genera testo, immagini, video, speech (TTS) e musica da prompt e input a riga di comando.
  • Chat testuale con streaming e output strutturato: Supporta chat multi-turno, streaming, system prompt e output JSON con il comando mmx text chat.
  • Controlli per generazione immagini: Crea immagini con impostazioni di aspect ratio e generazione batch (--n), salvando i risultati in una directory di output.
  • Generazione video asincrona con tracciamento progresso: Avvia job video in modo asincrono (--async) e scarica i risultati in seguito usando identificativi di task/file.
  • Sintesi speech con voce, velocità e streaming: Genera TTS con oltre 30 voci, regola la velocità e streamma l'output audio a un media player.
  • Funzionalità generazione musica: Produce canzoni basate su testi, genera testi automatici da prompt (--lyrics-optimizer), crea tracce strumentali e cover da audio di riferimento.
  • Vision e ricerca dalla riga di comando: Usa mmx vision per descrivere immagini e mmx search per ricerca web, inclusa modalità output JSON.
  • Autenticazione e configurazione regione: Accedi con una API key e gestisci impostazioni regione (esempio include impostazione regione su cn).

Come Usare MiniMax-AI/cli

  1. Installa la CLI.
    • Per agent AI (OpenClaw, Cursor, Claude Code, ecc.): aggiungi la skill con npx skills add MiniMax-AI/cli -y -g.
    • Per uso terminale: installa globalmente con npm install -g mmx-cli.
  2. Autentica con la tua API key del piano token MiniMax:
    • mmx auth login --api-key sk-xxxxx
  3. Esegui un comando media. Ad esempio:
    • Testo: mmx text chat --message "What is MiniMax?"
    • Immagine: mmx image "A cat in a spacesuit"
    • Speech: mmx speech synthesize --text "Hello!" --out hello.mp3
    • Video: mmx video generate --prompt "Ocean waves at sunset"
    • Musica: mmx music generate --prompt "Upbeat pop" --lyrics "[verse] La da dee, sunny day"
  4. Usa modalità JSON quando necessario: pipe input (es. cat messages.json) nel comando chat e richiedi --output json.

Casi d'Uso

  • Workflow agent (assistenti coding): Aggiungi questa CLI come “skill” a un agent AI così l'agent può chiamare comandi come mmx text chat, mmx image o mmx video generate seguendo le convenzioni agent.
  • Creazione contenuti da terminale: Genera immagini, speech o musica da script senza costruire un'UI separata (es. creazione asset e salvataggio su path di output).
  • Risposte testuali streaming per lavoro interattivo: Usa mmx text chat --stream per gestire output incrementale in sessioni terminale quando vuoi osservare le risposte mentre si generano.
  • Pipeline media asincrone: Avvia un job generazione video con --async, poi recupera e scarica risultati in seguito con mmx video task get --task-id ... e mmx video download --file-id ....
  • Trasformazione media e cover musica: Genera tracce strumentali o crea versioni cover da file audio di riferimento con mmx music cover usando --audio-file o --audio.

FAQ

  • Quali tipi di media può generare la CLI? Il README elenca supporto per testo, immagini, video, speech (TTS) e musica, più vision (comprensione/descrizione immagini) e ricerca web.

  • Come autentico? Usa mmx auth login --api-key sk-xxxxx. La CLI fornisce anche comandi come mmx auth status, mmx auth refresh e mmx auth logout.

  • Posso usare output streaming? Sì. La chat testuale include opzione --stream, e la sintesi speech supporta modalità --stream (esempio pipe output su mpv -).

  • Come lavoro con output JSON per chat/ricerca? Gli esempi CLI mostrano --output json per comandi come chat testuale (inclusa pipe messaggi da file/STDIN) e per ricerca.

  • C'è supporto per endpoint Global e CN? Il progetto nota “Supporto seamless per Global (api.minimax.io) e CN (api.minimaxi.com)”, e include un comando esempio per impostare regione su cn (mmx config set --key region --value cn).

Alternative

  • Client HTTP API per MiniMax Platform: Se preferisci integrazione diretta, puoi chiamare gli endpoint della piattaforma dai tuoi script invece di usare questa CLI. Offre più controllo ma richiede gestione autenticazione e logica richiesta.
  • Altre CLI “tool/skill” per agent: Molti agent AI supportano attachment tool/skill; potresti usare un connettore tool diverso per generazione media agent-driven. La differenza è come il tool è esposto all'agent e invocati i comandi.
  • Generatori media UI-based dedicati: Per workflow non-developer, tool browser-based possono semplificare interazione prompt-to-output. Rispetto a una CLI, tipicamente scambiano flessibilità automazione/scripting con interfaccia guidata.