MiniMax-AI/cli
MiniMax-AI/cli è lo strumento CLI ufficiale della MiniMax AI Platform per generare testo, immagini, video, speech e musica, con vision e web search.
Cos'è MiniMax-AI/cli?
MiniMax-AI/cli è l'interfaccia a riga di comando (CLI) ufficiale della MiniMax AI Platform. Ti permette di generare ed elaborare molteplici tipi di media—testo, immagini, video, speech e musica—direttamente da un workflow di agent, terminale o pipeline di automazione.
La CLI è progettata per essere utilizzabile in ambienti agent (“da qualsiasi agent o terminale”) e supporta sia le regioni globali che CN tramite endpoint API diversi.
Caratteristiche Principali
- Generazione multi-modale in un'unica CLI: Genera testo, immagini, video, speech (TTS) e musica da prompt e input a riga di comando.
- Chat testuale con streaming e output strutturato: Supporta chat multi-turno, streaming, system prompt e output JSON con il comando
mmx text chat. - Controlli per generazione immagini: Crea immagini con impostazioni di aspect ratio e generazione batch (
--n), salvando i risultati in una directory di output. - Generazione video asincrona con tracciamento progresso: Avvia job video in modo asincrono (
--async) e scarica i risultati in seguito usando identificativi di task/file. - Sintesi speech con voce, velocità e streaming: Genera TTS con oltre 30 voci, regola la velocità e streamma l'output audio a un media player.
- Funzionalità generazione musica: Produce canzoni basate su testi, genera testi automatici da prompt (
--lyrics-optimizer), crea tracce strumentali e cover da audio di riferimento. - Vision e ricerca dalla riga di comando: Usa
mmx visionper descrivere immagini emmx searchper ricerca web, inclusa modalità output JSON. - Autenticazione e configurazione regione: Accedi con una API key e gestisci impostazioni regione (esempio include impostazione regione su
cn).
Come Usare MiniMax-AI/cli
- Installa la CLI.
- Per agent AI (OpenClaw, Cursor, Claude Code, ecc.): aggiungi la skill con
npx skills add MiniMax-AI/cli -y -g. - Per uso terminale: installa globalmente con
npm install -g mmx-cli.
- Per agent AI (OpenClaw, Cursor, Claude Code, ecc.): aggiungi la skill con
- Autentica con la tua API key del piano token MiniMax:
mmx auth login --api-key sk-xxxxx
- Esegui un comando media. Ad esempio:
- Testo:
mmx text chat --message "What is MiniMax?" - Immagine:
mmx image "A cat in a spacesuit" - Speech:
mmx speech synthesize --text "Hello!" --out hello.mp3 - Video:
mmx video generate --prompt "Ocean waves at sunset" - Musica:
mmx music generate --prompt "Upbeat pop" --lyrics "[verse] La da dee, sunny day"
- Testo:
- Usa modalità JSON quando necessario: pipe input (es.
cat messages.json) nel comando chat e richiedi--output json.
Casi d'Uso
- Workflow agent (assistenti coding): Aggiungi questa CLI come “skill” a un agent AI così l'agent può chiamare comandi come
mmx text chat,mmx imageommx video generateseguendo le convenzioni agent. - Creazione contenuti da terminale: Genera immagini, speech o musica da script senza costruire un'UI separata (es. creazione asset e salvataggio su path di output).
- Risposte testuali streaming per lavoro interattivo: Usa
mmx text chat --streamper gestire output incrementale in sessioni terminale quando vuoi osservare le risposte mentre si generano. - Pipeline media asincrone: Avvia un job generazione video con
--async, poi recupera e scarica risultati in seguito conmmx video task get --task-id ...emmx video download --file-id .... - Trasformazione media e cover musica: Genera tracce strumentali o crea versioni cover da file audio di riferimento con
mmx music coverusando--audio-fileo--audio.
FAQ
-
Quali tipi di media può generare la CLI? Il README elenca supporto per testo, immagini, video, speech (TTS) e musica, più vision (comprensione/descrizione immagini) e ricerca web.
-
Come autentico? Usa
mmx auth login --api-key sk-xxxxx. La CLI fornisce anche comandi comemmx auth status,mmx auth refreshemmx auth logout. -
Posso usare output streaming? Sì. La chat testuale include opzione
--stream, e la sintesi speech supporta modalità--stream(esempio pipe output sumpv -). -
Come lavoro con output JSON per chat/ricerca? Gli esempi CLI mostrano
--output jsonper comandi come chat testuale (inclusa pipe messaggi da file/STDIN) e per ricerca. -
C'è supporto per endpoint Global e CN? Il progetto nota “Supporto seamless per Global (api.minimax.io) e CN (api.minimaxi.com)”, e include un comando esempio per impostare regione su
cn(mmx config set --key region --value cn).
Alternative
- Client HTTP API per MiniMax Platform: Se preferisci integrazione diretta, puoi chiamare gli endpoint della piattaforma dai tuoi script invece di usare questa CLI. Offre più controllo ma richiede gestione autenticazione e logica richiesta.
- Altre CLI “tool/skill” per agent: Molti agent AI supportano attachment tool/skill; potresti usare un connettore tool diverso per generazione media agent-driven. La differenza è come il tool è esposto all'agent e invocati i comandi.
- Generatori media UI-based dedicati: Per workflow non-developer, tool browser-based possono semplificare interazione prompt-to-output. Rispetto a una CLI, tipicamente scambiano flessibilità automazione/scripting con interfaccia guidata.
Alternative
紫东太初
Un nuovo modello multimodale di grandi dimensioni di nuova generazione lanciato dall'Istituto di Automazione dell'Accademia Cinese delle Scienze e dall'Istituto di Ricerca sull'Intelligenza Artificiale di Wuhan, che supporta domande e risposte in più turni, creazione di testi, generazione di immagini e compiti di domande e risposte completi.
PXZ AI
Una piattaforma AI tutto in uno che combina strumenti per immagini, video, voce, scrittura e chat per migliorare la creatività e la collaborazione.
Slidesgo
Scopri temi e template PowerPoint gratuiti per Google Slides su Slidesgo: scarica, personalizza online e usa i modelli per creare presentazioni.
Grok AI Assistant
Grok è un assistente AI gratuito sviluppato da xAI, progettato per dare priorità alla verità e all'obiettività, offrendo al contempo capacità avanzate come l'accesso a informazioni in tempo reale e la generazione di immagini.
AakarDev AI
AakarDev AI è una piattaforma potente che semplifica lo sviluppo di applicazioni AI con integrazione fluida dei database vettoriali, consentendo un rapido deployment e scalabilità.
Oli: Pregnancy Safety Scanner
Oli: Pregnancy Safety Scanner ti aiuta a verificare la sicurezza di cibi, skincare, integratori e altri prodotti in gravidanza con scansione e valutazioni personalizzate.