MiniMax-AI/cli
MiniMax-AI/cli ist das offizielle CLI der MiniMax AI Platform zum Generieren von Text, Bildern, Video, Sprache und Musik – inkl. Vision & Websuche.
Was ist MiniMax-AI/cli?
MiniMax-AI/cli ist die offizielle Kommandozeilenoberfläche (CLI) für die MiniMax AI Platform. Sie ermöglicht das Generieren und Verarbeiten mehrerer Medientypen – Text, Bilder, Video, Sprache und Musik – direkt aus einem Agenten-Workflow, Terminal oder Automatisierungspipeline.
Die CLI ist für den Einsatz in Agentenumgebungen konzipiert („von jedem Agenten oder Terminal“) und unterstützt globale sowie CN-Regionen über unterschiedliche API-Endpunkte.
Wichtige Funktionen
- Multimodale Generierung in einer CLI: Generieren Sie Text, Bilder, Video, Sprache (TTS) und Musik aus Kommandozeilen-Prompts und -Eingaben.
- Text-Chat mit Streaming und strukturiertem Output: Unterstützt Multi-Turn-Chat, Streaming, System-Prompts und JSON-Output mit dem Befehl
mmx text chat. - Bildgenerierungssteuerung: Erstellen Sie Bilder mit Seitenverhältnis-Einstellungen und Batch-Generierung (
--n) und speichern Sie Ergebnisse in einem Ausgabeverzeichnis. - Asynchrone Videogenerierung mit Fortschrittsverfolgung: Starten Sie Video-Jobs asynchron (
--async) und laden Sie später Ergebnisse mit Task-/Datei-IDs herunter. - Sprachsynthese mit Stimme, Geschwindigkeit und Streaming: Generieren Sie TTS mit über 30 Stimmen, passen Sie Geschwindigkeit an und streamen Sie Audioausgabe an einen Mediaplayer.
- Musikgenerierungsfunktionen: Erstellen Sie lyrics-basierte Songs, generieren Sie Auto-Lyrics aus Prompts (
--lyrics-optimizer), produzieren Sie instrumentale Tracks und Cover aus Referenzaudio. - Vision und Suche aus der Kommandozeile: Nutzen Sie
mmx visionzur Bildbeschreibung undmmx searchfür Websuche, inkl. JSON-Output-Modus. - Authentifizierung und Regionseinstellung: Melden Sie sich mit einem API-Key an und verwalten Sie Regionseinstellungen (Beispiel: Region auf
cnsetzen).
So verwenden Sie MiniMax-AI/cli
- Installieren Sie die CLI.
- Für AI-Agenten (OpenClaw, Cursor, Claude Code etc.): Fügen Sie die Skill mit
npx skills add MiniMax-AI/cli -y -ghinzu. - Für Terminal-Nutzung: Installieren Sie global mit
npm install -g mmx-cli.
- Für AI-Agenten (OpenClaw, Cursor, Claude Code etc.): Fügen Sie die Skill mit
- Authentifizieren Sie sich mit Ihrem MiniMax-Token-Plan-API-Key:
mmx auth login --api-key sk-xxxxx
- Führen Sie einen Media-Befehl aus. Beispiele:
- Text:
mmx text chat --message "What is MiniMax?" - Bild:
mmx image "A cat in a spacesuit" - Sprache:
mmx speech synthesize --text "Hello!" --out hello.mp3 - Video:
mmx video generate --prompt "Ocean waves at sunset" - Musik:
mmx music generate --prompt "Upbeat pop" --lyrics "[verse] La da dee, sunny day"
- Text:
- JSON-Modus bei Bedarf nutzen: Leiten Sie Eingabe (z. B.
cat messages.json) in den Chat-Befehl und fordern Sie--output jsonan.
Anwendungsfälle
- Agenten-Workflows (Coding-Assistenten): Fügen Sie diese CLI als „Skill“ zu einem AI-Agenten hinzu, damit der Agent Befehle wie
mmx text chat,mmx imageodermmx video generateaufrufen kann – unter Einhaltung der Agentenkonventionen. - Terminal-basierte Inhaltserstellung: Generieren Sie Bilder, Sprache oder Musik aus Skripten ohne separate UI (z. B. Assets erstellen und in einen Ausgabepfad speichern).
- Streaming-Textantworten für interaktive Arbeit: Nutzen Sie
mmx text chat --streamfür inkrementellen Output in Terminal-Sitzungen, um Antworten während der Generierung zu beobachten. - Asynchrone Media-Pipelines: Starten Sie einen Video-Job mit
--async, holen Sie später Ergebnisse mitmmx video task get --task-id ...ab und laden Sie mitmmx video download --file-id ...herunter. - Media-Transformation und Musik-Cover: Generieren Sie instrumentale Tracks oder Cover-Versionen aus einer Referenzaudio-Datei mit
mmx music coverund--audio-fileoder--audio.
FAQ
-
Welche Medientypen kann die CLI generieren? Die README listet Unterstützung für Text, Bilder, Video, Sprache (TTS) und Musik, plus Vision (Bildverständnis/Beschreibung) und Websuche auf.
-
Wie authentifiziere ich mich? Verwenden Sie
mmx auth login --api-key sk-xxxxx. Die CLI bietet Befehle wiemmx auth status,mmx auth refreshundmmx auth logout. -
Kann ich Streaming-Output nutzen? Ja. Text-Chat enthält eine
--stream-Option, und Sprachsynthese unterstützt--stream-Modus (Beispiel leitet Output anmpv -weiter). -
Wie arbeite ich mit JSON-Outputs für Chat/Suche? CLI-Beispiele zeigen
--output jsonfür Befehle wie Text-Chat (inkl. Weiterleitung von Nachrichten aus Datei/STDIN) und Suche. -
Gibt es Unterstützung für Global- und CN-Endpunkte? Das Projekt erwähnt „Nahtlose Global (api.minimax.io) und CN (api.minimaxi.com) Unterstützung“ und enthält ein Beispielbefehl zum Setzen der Region auf
cn(mmx config set --key region --value cn).
Alternativen
- HTTP-API-Clients für die MiniMax Platform: Bei Vorliebe für direkte Integration rufen Sie Platform-Endpunkte aus eigenen Skripten auf statt dieser CLI zu nutzen. Das bietet mehr Kontrolle, erfordert aber Authentifizierung und Request-Logik.
- Andere Agenten-„Tool/Skill“-CLIs: Viele AI-Agenten unterstützen das Anhängen von Tools/Skills; Sie könnten einen anderen Tool-Connector für agentengetriebene Mediengenerierung verwenden. Der Unterschied liegt darin, wie das Tool dem Agenten präsentiert und Befehle ausgeführt werden.
- Dedizierte UI-basierte Mediengeneratoren: Für Non-Developer-Workflows vereinfachen browserbasierte Tools die Prompt-to-Output-Interaktion. Im Vergleich zur CLI opfern sie Automatisierungs- und Skriptflexibilität für eine geführte Oberfläche.
Alternativen
PXZ AI
Eine All-in-One AI-Plattform, die Werkzeuge für Bild, Video, Sprache, Schreiben und Chat kombiniert, um Kreativität und Zusammenarbeit zu fördern.
Slidesgo
Entdecke kostenlose Google Slides-Themes und PowerPoint-Vorlagen auf Slidesgo. Herunterladen, online anpassen und für Präsentationen nutzen.
Grok AI Assistant
Grok ist ein kostenloser KI-Assistent, der von xAI entwickelt wurde und darauf ausgelegt ist, Wahrheit und Objektivität zu priorisieren, während er fortschrittliche Funktionen wie Echtzeit-Informationszugriff und Bilderzeugung bietet.
Creativly
Creativly ist ein browserbasiertes Kreativ-Tool für promptfreies Erstellen: einfach starten, schnell kreative Outputs generieren und iterieren.
AakarDev AI
AakarDev AI ist eine leistungsstarke Plattform, die die Entwicklung von KI-Anwendungen mit nahtloser Integration von Vektordatenbanken vereinfacht und eine schnelle Bereitstellung und Skalierbarkeit ermöglicht.
Oli: Pregnancy Safety Scanner
Oli: Pregnancy Safety Scanner hilft dir mit Barcode-/Foto-Scan und trimesterangepassten Bewertungen dabei, Lebensmittel, Pflege, Supplements & mehr in der Schwangerschaft zu prüfen.