MiniMax-AI/cli
MiniMax-AI/cli, la herramienta CLI oficial de MiniMax AI Platform para generar texto, imágenes, video, voz y música, con visión y búsqueda web.
¿Qué es MiniMax-AI/cli?
MiniMax-AI/cli es la interfaz de línea de comandos (CLI) oficial de la MiniMax AI Platform. Permite generar y procesar múltiples tipos de medios —texto, imágenes, video, voz y música— directamente desde un flujo de trabajo de agente, terminal o pipeline de automatización.
La CLI está diseñada para usarse en entornos de agentes (“desde cualquier agente o terminal”) y soporta regiones global y CN mediante diferentes endpoints de API.
Características principales
- Generación multimodal en una sola CLI: Genera texto, imágenes, video, voz (TTS) y música desde prompts e inputs en línea de comandos.
- Chat de texto con streaming y salida estructurada: Soporta chat multigiro, streaming, prompts de sistema y salida JSON con el comando
mmx text chat. - Controles de generación de imágenes: Crea imágenes con ajustes de relación de aspecto y generación por lotes (
--n), y guarda resultados en un directorio de salida. - Generación de video asíncrona con seguimiento de progreso: Inicia trabajos de video de forma asíncrona (
--async) y descarga resultados después usando identificadores de tarea/archivo. - Síntesis de voz con voz, velocidad y streaming: Genera TTS con más de 30 voces, ajusta velocidad y transmite salida de audio a un reproductor multimedia.
- Funciones de generación de música: Produce canciones basadas en letras, genera letras automáticas desde prompts (
--lyrics-optimizer), crea pistas instrumentales y genera covers desde audio de referencia. - Visión y búsqueda desde la línea de comandos: Usa
mmx visionpara describir imágenes ymmx searchpara búsqueda web, incluyendo modo de salida JSON. - Autenticación y configuración de región: Inicia sesión con una clave API y gestiona ajustes de región (ejemplo: establecer región en
cn).
Cómo usar MiniMax-AI/cli
- Instala la CLI.
- Para agentes de IA (OpenClaw, Cursor, Claude Code, etc.): agrega la skill con
npx skills add MiniMax-AI/cli -y -g. - Para uso en terminal: instala globalmente con
npm install -g mmx-cli.
- Para agentes de IA (OpenClaw, Cursor, Claude Code, etc.): agrega la skill con
- Autentícate con tu clave API del plan de tokens de MiniMax:
mmx auth login --api-key sk-xxxxx
- Ejecuta un comando de medios. Por ejemplo:
- Texto:
mmx text chat --message "What is MiniMax?" - Imagen:
mmx image "A cat in a spacesuit" - Voz:
mmx speech synthesize --text "Hello!" --out hello.mp3 - Video:
mmx video generate --prompt "Ocean waves at sunset" - Música:
mmx music generate --prompt "Upbeat pop" --lyrics "[verse] La da dee, sunny day"
- Texto:
- Usa modo JSON cuando sea necesario: pasa input (p. ej.,
cat messages.json) al comando de chat y solicita--output json.
Casos de uso
- Flujos de trabajo de agentes (asistentes de codificación): Agrega esta CLI como una “skill” a un agente de IA para que pueda llamar comandos como
mmx text chat,mmx imageommx video generatesiguiendo las convenciones del agente. - Creación de contenido desde terminal: Genera imágenes, voz o música desde scripts sin construir una UI separada (por ejemplo, creando assets y guardándolos en una ruta de salida).
- Respuestas de texto en streaming para trabajo interactivo: Usa
mmx text chat --streampara manejar salida incremental en sesiones de terminal cuando quieras observar las respuestas mientras se generan. - Pipelines de medios asíncronos: Inicia un trabajo de generación de video con
--async, luego recupera y descarga resultados después conmmx video task get --task-id ...ymmx video download --file-id .... - Transformación de medios y covers de música: Genera pistas instrumentales o crea versiones cover desde un archivo de audio de referencia usando
mmx music covercon--audio-fileo--audio.
Preguntas frecuentes
-
¿Qué tipos de medios puede generar la CLI? El README lista soporte para texto, imágenes, video, voz (TTS) y música, además de visión (comprensión/descripción de imágenes) y búsqueda web.
-
¿Cómo autentico? Usa
mmx auth login --api-key sk-xxxxx. La CLI también ofrece comandos comommx auth status,mmx auth refreshymmx auth logout. -
¿Puedo usar salida en streaming? Sí. El chat de texto incluye la opción
--stream, y la síntesis de voz soporta modo--stream(ejemplo: pasa salida ampv -). -
¿Cómo trabajo con salidas JSON para chat/búsqueda? Los ejemplos de la CLI muestran
--output jsonpara comandos como chat de texto (incluyendo pasar mensajes desde archivo/STDIN) y para búsqueda. -
¿Hay soporte para endpoints Global y CN? El proyecto indica “Soporte fluido para Global (api.minimax.io) y CN (api.minimaxi.com)”, e incluye un comando de ejemplo para establecer la región en
cn(mmx config set --key region --value cn).
Alternativas
- Clientes HTTP API para la MiniMax Platform: Si prefieres integración directa, puedes llamar los endpoints de la plataforma desde tus propios scripts en lugar de usar esta CLI. Ofrece más control, pero requiere manejar autenticación y lógica de solicitudes.
- Otras CLIs de “herramientas/skills” para agentes: Muchos agentes de IA soportan adjuntar herramientas/skills; podrías usar un conector de herramientas diferente para generación de medios impulsada por agente. La diferencia está en cómo se expone la herramienta al agente y cómo se invocan los comandos.
- Generadores de medios basados en UI dedicada: Para flujos no desarrolladores, herramientas basadas en navegador pueden simplificar la interacción de prompt a salida. Comparado con una CLI, suelen intercambiar flexibilidad de automatización y scripting por una interfaz guiada.
Alternativas
紫东太初
Un nuevo modelo grande multimodal de última generación lanzado por el Instituto de Automatización de la Academia China de Ciencias y el Instituto de Investigación de Inteligencia Artificial de Wuhan, que admite preguntas y respuestas en múltiples turnos, creación de texto, generación de imágenes y tareas de preguntas y respuestas integrales.
PXZ AI
Una plataforma de IA todo en uno que combina herramientas para imagen, video, voz, escritura y chat para mejorar la creatividad y la colaboración.
Slidesgo
Descubre temas gratuitos de Google Slides y plantillas de PowerPoint en Slidesgo. Descarga, personaliza online y crea presentaciones.
Grok AI Assistant
Grok es un asistente de IA gratuito desarrollado por xAI, diseñado para priorizar la verdad y la objetividad al tiempo que ofrece capacidades avanzadas como acceso a información en tiempo real y generación de imágenes.
AakarDev AI
AakarDev AI es una plataforma poderosa que simplifica el desarrollo de aplicaciones de IA con integración fluida de bases de datos vectoriales, permitiendo un despliegue y escalabilidad rápidos.
Oli: Pregnancy Safety Scanner
Oli: Pregnancy Safety Scanner te ayuda a comprobar si alimentos, cosméticos, suplementos y otros productos son seguros en el embarazo con escaneo por código/foto.