MiniMax-AI/cli
MiniMax-AI/cli ist das offizielle CLI der MiniMax AI Platform zum Generieren von Text, Bildern, Video, Sprache und Musik – inkl. Vision & Websuche.
Was ist MiniMax-AI/cli?
MiniMax-AI/cli ist die offizielle Kommandozeilenoberfläche (CLI) für die MiniMax AI Platform. Sie ermöglicht das Generieren und Verarbeiten mehrerer Medientypen – Text, Bilder, Video, Sprache und Musik – direkt aus einem Agenten-Workflow, Terminal oder Automatisierungspipeline.
Die CLI ist für den Einsatz in Agentenumgebungen konzipiert („von jedem Agenten oder Terminal“) und unterstützt globale sowie CN-Regionen über unterschiedliche API-Endpunkte.
Wichtige Funktionen
- Multimodale Generierung in einer CLI: Generieren Sie Text, Bilder, Video, Sprache (TTS) und Musik aus Kommandozeilen-Prompts und -Eingaben.
- Text-Chat mit Streaming und strukturiertem Output: Unterstützt Multi-Turn-Chat, Streaming, System-Prompts und JSON-Output mit dem Befehl
mmx text chat. - Bildgenerierungssteuerung: Erstellen Sie Bilder mit Seitenverhältnis-Einstellungen und Batch-Generierung (
--n) und speichern Sie Ergebnisse in einem Ausgabeverzeichnis. - Asynchrone Videogenerierung mit Fortschrittsverfolgung: Starten Sie Video-Jobs asynchron (
--async) und laden Sie später Ergebnisse mit Task-/Datei-IDs herunter. - Sprachsynthese mit Stimme, Geschwindigkeit und Streaming: Generieren Sie TTS mit über 30 Stimmen, passen Sie Geschwindigkeit an und streamen Sie Audioausgabe an einen Mediaplayer.
- Musikgenerierungsfunktionen: Erstellen Sie lyrics-basierte Songs, generieren Sie Auto-Lyrics aus Prompts (
--lyrics-optimizer), produzieren Sie instrumentale Tracks und Cover aus Referenzaudio. - Vision und Suche aus der Kommandozeile: Nutzen Sie
mmx visionzur Bildbeschreibung undmmx searchfür Websuche, inkl. JSON-Output-Modus. - Authentifizierung und Regionseinstellung: Melden Sie sich mit einem API-Key an und verwalten Sie Regionseinstellungen (Beispiel: Region auf
cnsetzen).
So verwenden Sie MiniMax-AI/cli
- Installieren Sie die CLI.
- Für AI-Agenten (OpenClaw, Cursor, Claude Code etc.): Fügen Sie die Skill mit
npx skills add MiniMax-AI/cli -y -ghinzu. - Für Terminal-Nutzung: Installieren Sie global mit
npm install -g mmx-cli.
- Für AI-Agenten (OpenClaw, Cursor, Claude Code etc.): Fügen Sie die Skill mit
- Authentifizieren Sie sich mit Ihrem MiniMax-Token-Plan-API-Key:
mmx auth login --api-key sk-xxxxx
- Führen Sie einen Media-Befehl aus. Beispiele:
- Text:
mmx text chat --message "What is MiniMax?" - Bild:
mmx image "A cat in a spacesuit" - Sprache:
mmx speech synthesize --text "Hello!" --out hello.mp3 - Video:
mmx video generate --prompt "Ocean waves at sunset" - Musik:
mmx music generate --prompt "Upbeat pop" --lyrics "[verse] La da dee, sunny day"
- Text:
- JSON-Modus bei Bedarf nutzen: Leiten Sie Eingabe (z. B.
cat messages.json) in den Chat-Befehl und fordern Sie--output jsonan.
Anwendungsfälle
- Agenten-Workflows (Coding-Assistenten): Fügen Sie diese CLI als „Skill“ zu einem AI-Agenten hinzu, damit der Agent Befehle wie
mmx text chat,mmx imageodermmx video generateaufrufen kann – unter Einhaltung der Agentenkonventionen. - Terminal-basierte Inhaltserstellung: Generieren Sie Bilder, Sprache oder Musik aus Skripten ohne separate UI (z. B. Assets erstellen und in einen Ausgabepfad speichern).
- Streaming-Textantworten für interaktive Arbeit: Nutzen Sie
mmx text chat --streamfür inkrementellen Output in Terminal-Sitzungen, um Antworten während der Generierung zu beobachten. - Asynchrone Media-Pipelines: Starten Sie einen Video-Job mit
--async, holen Sie später Ergebnisse mitmmx video task get --task-id ...ab und laden Sie mitmmx video download --file-id ...herunter. - Media-Transformation und Musik-Cover: Generieren Sie instrumentale Tracks oder Cover-Versionen aus einer Referenzaudio-Datei mit
mmx music coverund--audio-fileoder--audio.
FAQ
-
Welche Medientypen kann die CLI generieren? Die README listet Unterstützung für Text, Bilder, Video, Sprache (TTS) und Musik, plus Vision (Bildverständnis/Beschreibung) und Websuche auf.
-
Wie authentifiziere ich mich? Verwenden Sie
mmx auth login --api-key sk-xxxxx. Die CLI bietet Befehle wiemmx auth status,mmx auth refreshundmmx auth logout. -
Kann ich Streaming-Output nutzen? Ja. Text-Chat enthält eine
--stream-Option, und Sprachsynthese unterstützt--stream-Modus (Beispiel leitet Output anmpv -weiter). -
Wie arbeite ich mit JSON-Outputs für Chat/Suche? CLI-Beispiele zeigen
--output jsonfür Befehle wie Text-Chat (inkl. Weiterleitung von Nachrichten aus Datei/STDIN) und Suche. -
Gibt es Unterstützung für Global- und CN-Endpunkte? Das Projekt erwähnt „Nahtlose Global (api.minimax.io) und CN (api.minimaxi.com) Unterstützung“ und enthält ein Beispielbefehl zum Setzen der Region auf
cn(mmx config set --key region --value cn).
Alternativen
- HTTP-API-Clients für die MiniMax Platform: Bei Vorliebe für direkte Integration rufen Sie Platform-Endpunkte aus eigenen Skripten auf statt dieser CLI zu nutzen. Das bietet mehr Kontrolle, erfordert aber Authentifizierung und Request-Logik.
- Andere Agenten-„Tool/Skill“-CLIs: Viele AI-Agenten unterstützen das Anhängen von Tools/Skills; Sie könnten einen anderen Tool-Connector für agentengetriebene Mediengenerierung verwenden. Der Unterschied liegt darin, wie das Tool dem Agenten präsentiert und Befehle ausgeführt werden.
- Dedizierte UI-basierte Mediengeneratoren: Für Non-Developer-Workflows vereinfachen browserbasierte Tools die Prompt-to-Output-Interaktion. Im Vergleich zur CLI opfern sie Automatisierungs- und Skriptflexibilität für eine geführte Oberfläche.
Alternativen
紫东太初
Ein neues multimodales Großmodell der nächsten Generation, das vom Institut für Automation der Chinesischen Akademie der Wissenschaften und dem Wuhan Institut für Künstliche Intelligenz eingeführt wurde, unterstützt Mehrfach-Q&A, Textkreation, Bildgenerierung und umfassende Q&A-Aufgaben.
PXZ AI
Eine All-in-One AI-Plattform, die Werkzeuge für Bild, Video, Sprache, Schreiben und Chat kombiniert, um Kreativität und Zusammenarbeit zu fördern.
Slidesgo
Entdecke kostenlose Google Slides-Themes und PowerPoint-Vorlagen auf Slidesgo. Herunterladen, online anpassen und für Präsentationen nutzen.
Grok AI Assistant
Grok ist ein kostenloser KI-Assistent, der von xAI entwickelt wurde und darauf ausgelegt ist, Wahrheit und Objektivität zu priorisieren, während er fortschrittliche Funktionen wie Echtzeit-Informationszugriff und Bilderzeugung bietet.
AakarDev AI
AakarDev AI ist eine leistungsstarke Plattform, die die Entwicklung von KI-Anwendungen mit nahtloser Integration von Vektordatenbanken vereinfacht und eine schnelle Bereitstellung und Skalierbarkeit ermöglicht.
Oli: Pregnancy Safety Scanner
Oli: Pregnancy Safety Scanner hilft dir mit Barcode-/Foto-Scan und trimesterangepassten Bewertungen dabei, Lebensmittel, Pflege, Supplements & mehr in der Schwangerschaft zu prüfen.