UStackUStack
MiniMax-AI/cli icon

MiniMax-AI/cli

MiniMax-AI/cli ist das offizielle CLI der MiniMax AI Platform zum Generieren von Text, Bildern, Video, Sprache und Musik – inkl. Vision & Websuche.

MiniMax-AI/cli

Was ist MiniMax-AI/cli?

MiniMax-AI/cli ist die offizielle Kommandozeilenoberfläche (CLI) für die MiniMax AI Platform. Sie ermöglicht das Generieren und Verarbeiten mehrerer Medientypen – Text, Bilder, Video, Sprache und Musik – direkt aus einem Agenten-Workflow, Terminal oder Automatisierungspipeline.

Die CLI ist für den Einsatz in Agentenumgebungen konzipiert („von jedem Agenten oder Terminal“) und unterstützt globale sowie CN-Regionen über unterschiedliche API-Endpunkte.

Wichtige Funktionen

  • Multimodale Generierung in einer CLI: Generieren Sie Text, Bilder, Video, Sprache (TTS) und Musik aus Kommandozeilen-Prompts und -Eingaben.
  • Text-Chat mit Streaming und strukturiertem Output: Unterstützt Multi-Turn-Chat, Streaming, System-Prompts und JSON-Output mit dem Befehl mmx text chat.
  • Bildgenerierungssteuerung: Erstellen Sie Bilder mit Seitenverhältnis-Einstellungen und Batch-Generierung (--n) und speichern Sie Ergebnisse in einem Ausgabeverzeichnis.
  • Asynchrone Videogenerierung mit Fortschrittsverfolgung: Starten Sie Video-Jobs asynchron (--async) und laden Sie später Ergebnisse mit Task-/Datei-IDs herunter.
  • Sprachsynthese mit Stimme, Geschwindigkeit und Streaming: Generieren Sie TTS mit über 30 Stimmen, passen Sie Geschwindigkeit an und streamen Sie Audioausgabe an einen Mediaplayer.
  • Musikgenerierungsfunktionen: Erstellen Sie lyrics-basierte Songs, generieren Sie Auto-Lyrics aus Prompts (--lyrics-optimizer), produzieren Sie instrumentale Tracks und Cover aus Referenzaudio.
  • Vision und Suche aus der Kommandozeile: Nutzen Sie mmx vision zur Bildbeschreibung und mmx search für Websuche, inkl. JSON-Output-Modus.
  • Authentifizierung und Regionseinstellung: Melden Sie sich mit einem API-Key an und verwalten Sie Regionseinstellungen (Beispiel: Region auf cn setzen).

So verwenden Sie MiniMax-AI/cli

  1. Installieren Sie die CLI.
    • Für AI-Agenten (OpenClaw, Cursor, Claude Code etc.): Fügen Sie die Skill mit npx skills add MiniMax-AI/cli -y -g hinzu.
    • Für Terminal-Nutzung: Installieren Sie global mit npm install -g mmx-cli.
  2. Authentifizieren Sie sich mit Ihrem MiniMax-Token-Plan-API-Key:
    • mmx auth login --api-key sk-xxxxx
  3. Führen Sie einen Media-Befehl aus. Beispiele:
    • Text: mmx text chat --message "What is MiniMax?"
    • Bild: mmx image "A cat in a spacesuit"
    • Sprache: mmx speech synthesize --text "Hello!" --out hello.mp3
    • Video: mmx video generate --prompt "Ocean waves at sunset"
    • Musik: mmx music generate --prompt "Upbeat pop" --lyrics "[verse] La da dee, sunny day"
  4. JSON-Modus bei Bedarf nutzen: Leiten Sie Eingabe (z. B. cat messages.json) in den Chat-Befehl und fordern Sie --output json an.

Anwendungsfälle

  • Agenten-Workflows (Coding-Assistenten): Fügen Sie diese CLI als „Skill“ zu einem AI-Agenten hinzu, damit der Agent Befehle wie mmx text chat, mmx image oder mmx video generate aufrufen kann – unter Einhaltung der Agentenkonventionen.
  • Terminal-basierte Inhaltserstellung: Generieren Sie Bilder, Sprache oder Musik aus Skripten ohne separate UI (z. B. Assets erstellen und in einen Ausgabepfad speichern).
  • Streaming-Textantworten für interaktive Arbeit: Nutzen Sie mmx text chat --stream für inkrementellen Output in Terminal-Sitzungen, um Antworten während der Generierung zu beobachten.
  • Asynchrone Media-Pipelines: Starten Sie einen Video-Job mit --async, holen Sie später Ergebnisse mit mmx video task get --task-id ... ab und laden Sie mit mmx video download --file-id ... herunter.
  • Media-Transformation und Musik-Cover: Generieren Sie instrumentale Tracks oder Cover-Versionen aus einer Referenzaudio-Datei mit mmx music cover und --audio-file oder --audio.

FAQ

  • Welche Medientypen kann die CLI generieren? Die README listet Unterstützung für Text, Bilder, Video, Sprache (TTS) und Musik, plus Vision (Bildverständnis/Beschreibung) und Websuche auf.

  • Wie authentifiziere ich mich? Verwenden Sie mmx auth login --api-key sk-xxxxx. Die CLI bietet Befehle wie mmx auth status, mmx auth refresh und mmx auth logout.

  • Kann ich Streaming-Output nutzen? Ja. Text-Chat enthält eine --stream-Option, und Sprachsynthese unterstützt --stream-Modus (Beispiel leitet Output an mpv - weiter).

  • Wie arbeite ich mit JSON-Outputs für Chat/Suche? CLI-Beispiele zeigen --output json für Befehle wie Text-Chat (inkl. Weiterleitung von Nachrichten aus Datei/STDIN) und Suche.

  • Gibt es Unterstützung für Global- und CN-Endpunkte? Das Projekt erwähnt „Nahtlose Global (api.minimax.io) und CN (api.minimaxi.com) Unterstützung“ und enthält ein Beispielbefehl zum Setzen der Region auf cn (mmx config set --key region --value cn).

Alternativen

  • HTTP-API-Clients für die MiniMax Platform: Bei Vorliebe für direkte Integration rufen Sie Platform-Endpunkte aus eigenen Skripten auf statt dieser CLI zu nutzen. Das bietet mehr Kontrolle, erfordert aber Authentifizierung und Request-Logik.
  • Andere Agenten-„Tool/Skill“-CLIs: Viele AI-Agenten unterstützen das Anhängen von Tools/Skills; Sie könnten einen anderen Tool-Connector für agentengetriebene Mediengenerierung verwenden. Der Unterschied liegt darin, wie das Tool dem Agenten präsentiert und Befehle ausgeführt werden.
  • Dedizierte UI-basierte Mediengeneratoren: Für Non-Developer-Workflows vereinfachen browserbasierte Tools die Prompt-to-Output-Interaktion. Im Vergleich zur CLI opfern sie Automatisierungs- und Skriptflexibilität für eine geführte Oberfläche.