UStackUStack
MiniMax-AI/cli icon

MiniMax-AI/cli

MiniMax-AI/cli, la herramienta CLI oficial de MiniMax AI Platform para generar texto, imágenes, video, voz y música, con visión y búsqueda web.

MiniMax-AI/cli

¿Qué es MiniMax-AI/cli?

MiniMax-AI/cli es la interfaz de línea de comandos (CLI) oficial de la MiniMax AI Platform. Permite generar y procesar múltiples tipos de medios —texto, imágenes, video, voz y música— directamente desde un flujo de trabajo de agente, terminal o pipeline de automatización.

La CLI está diseñada para usarse en entornos de agentes (“desde cualquier agente o terminal”) y soporta regiones global y CN mediante diferentes endpoints de API.

Características principales

  • Generación multimodal en una sola CLI: Genera texto, imágenes, video, voz (TTS) y música desde prompts e inputs en línea de comandos.
  • Chat de texto con streaming y salida estructurada: Soporta chat multigiro, streaming, prompts de sistema y salida JSON con el comando mmx text chat.
  • Controles de generación de imágenes: Crea imágenes con ajustes de relación de aspecto y generación por lotes (--n), y guarda resultados en un directorio de salida.
  • Generación de video asíncrona con seguimiento de progreso: Inicia trabajos de video de forma asíncrona (--async) y descarga resultados después usando identificadores de tarea/archivo.
  • Síntesis de voz con voz, velocidad y streaming: Genera TTS con más de 30 voces, ajusta velocidad y transmite salida de audio a un reproductor multimedia.
  • Funciones de generación de música: Produce canciones basadas en letras, genera letras automáticas desde prompts (--lyrics-optimizer), crea pistas instrumentales y genera covers desde audio de referencia.
  • Visión y búsqueda desde la línea de comandos: Usa mmx vision para describir imágenes y mmx search para búsqueda web, incluyendo modo de salida JSON.
  • Autenticación y configuración de región: Inicia sesión con una clave API y gestiona ajustes de región (ejemplo: establecer región en cn).

Cómo usar MiniMax-AI/cli

  1. Instala la CLI.
    • Para agentes de IA (OpenClaw, Cursor, Claude Code, etc.): agrega la skill con npx skills add MiniMax-AI/cli -y -g.
    • Para uso en terminal: instala globalmente con npm install -g mmx-cli.
  2. Autentícate con tu clave API del plan de tokens de MiniMax:
    • mmx auth login --api-key sk-xxxxx
  3. Ejecuta un comando de medios. Por ejemplo:
    • Texto: mmx text chat --message "What is MiniMax?"
    • Imagen: mmx image "A cat in a spacesuit"
    • Voz: mmx speech synthesize --text "Hello!" --out hello.mp3
    • Video: mmx video generate --prompt "Ocean waves at sunset"
    • Música: mmx music generate --prompt "Upbeat pop" --lyrics "[verse] La da dee, sunny day"
  4. Usa modo JSON cuando sea necesario: pasa input (p. ej., cat messages.json) al comando de chat y solicita --output json.

Casos de uso

  • Flujos de trabajo de agentes (asistentes de codificación): Agrega esta CLI como una “skill” a un agente de IA para que pueda llamar comandos como mmx text chat, mmx image o mmx video generate siguiendo las convenciones del agente.
  • Creación de contenido desde terminal: Genera imágenes, voz o música desde scripts sin construir una UI separada (por ejemplo, creando assets y guardándolos en una ruta de salida).
  • Respuestas de texto en streaming para trabajo interactivo: Usa mmx text chat --stream para manejar salida incremental en sesiones de terminal cuando quieras observar las respuestas mientras se generan.
  • Pipelines de medios asíncronos: Inicia un trabajo de generación de video con --async, luego recupera y descarga resultados después con mmx video task get --task-id ... y mmx video download --file-id ....
  • Transformación de medios y covers de música: Genera pistas instrumentales o crea versiones cover desde un archivo de audio de referencia usando mmx music cover con --audio-file o --audio.

Preguntas frecuentes

  • ¿Qué tipos de medios puede generar la CLI? El README lista soporte para texto, imágenes, video, voz (TTS) y música, además de visión (comprensión/descripción de imágenes) y búsqueda web.

  • ¿Cómo autentico? Usa mmx auth login --api-key sk-xxxxx. La CLI también ofrece comandos como mmx auth status, mmx auth refresh y mmx auth logout.

  • ¿Puedo usar salida en streaming? Sí. El chat de texto incluye la opción --stream, y la síntesis de voz soporta modo --stream (ejemplo: pasa salida a mpv -).

  • ¿Cómo trabajo con salidas JSON para chat/búsqueda? Los ejemplos de la CLI muestran --output json para comandos como chat de texto (incluyendo pasar mensajes desde archivo/STDIN) y para búsqueda.

  • ¿Hay soporte para endpoints Global y CN? El proyecto indica “Soporte fluido para Global (api.minimax.io) y CN (api.minimaxi.com)”, e incluye un comando de ejemplo para establecer la región en cn (mmx config set --key region --value cn).

Alternativas

  • Clientes HTTP API para la MiniMax Platform: Si prefieres integración directa, puedes llamar los endpoints de la plataforma desde tus propios scripts en lugar de usar esta CLI. Ofrece más control, pero requiere manejar autenticación y lógica de solicitudes.
  • Otras CLIs de “herramientas/skills” para agentes: Muchos agentes de IA soportan adjuntar herramientas/skills; podrías usar un conector de herramientas diferente para generación de medios impulsada por agente. La diferencia está en cómo se expone la herramienta al agente y cómo se invocan los comandos.
  • Generadores de medios basados en UI dedicada: Para flujos no desarrolladores, herramientas basadas en navegador pueden simplificar la interacción de prompt a salida. Comparado con una CLI, suelen intercambiar flexibilidad de automatización y scripting por una interfaz guiada.