UStackUStack
MiniMax-AI/cli icon

MiniMax-AI/cli

MiniMax-AI/cli — официальный CLI MiniMax AI Platform для генерации текста, изображений, видео, речи и музыки, а также vision и web search.

MiniMax-AI/cli

Что такое MiniMax-AI/cli?

MiniMax-AI/cli — официальный командный интерфейс (CLI) для MiniMax AI Platform. Он позволяет генерировать и обрабатывать различные типы медиа — текст, изображения, видео, речь и музыку — прямо из workflow агента, терминала или конвейера автоматизации.

CLI разработан для использования в средах агентов («из любого агента или терминала») и поддерживает глобальный и CN регионы через разные API-эндпоинты.

Ключевые возможности

  • Мультимодальная генерация в одном CLI: Генерируйте текст, изображения, видео, речь (TTS) и музыку из командной строки и входных данных.
  • Текстовый чат со стримингом и структурированным выводом: Поддерживает многотурный чат, стриминг, системные промпты и JSON-вывод с помощью команды mmx text chat.
  • Управление генерацией изображений: Создавайте изображения с настройками соотношения сторон и пакетной генерацией (--n), сохраняйте результаты в выходную директорию.
  • Асинхронная генерация видео с отслеживанием прогресса: Запускайте видео-задачи асинхронно (--async) и позже скачивайте результаты по идентификаторам задач/файлов.
  • Синтез речи с голосом, скоростью и стримингом: Генерируйте TTS с 30+ голосами, регулируйте скорость и стримьте аудиовывод в медиаплеер.
  • Возможности генерации музыки: Создавайте песни на основе текстов, генерируйте автотексты из промптов (--lyrics-optimizer), создавайте инструментальные треки и кавера из референсного аудио.
  • Vision и поиск из командной строки: Используйте mmx vision для описания изображений и mmx search для веб-поиска, включая режим JSON-выводa.
  • Аутентификация и настройка региона: Вход с API-ключом и управление настройками региона (пример: установка региона в cn).

Как использовать MiniMax-AI/cli

  1. Установите CLI.
    • Для AI-агентов (OpenClaw, Cursor, Claude Code и т.д.): добавьте навык с помощью npx skills add MiniMax-AI/cli -y -g.
    • Для терминала: установите глобально с npm install -g mmx-cli.
  2. Аутентифицируйтесь с API-ключом вашего плана MiniMax token:
    • mmx auth login --api-key sk-xxxxx
  3. Запустите медиа-команду. Например:
    • Текст: mmx text chat --message "What is MiniMax?"
    • Изображение: mmx image "A cat in a spacesuit"
    • Речь: mmx speech synthesize --text "Hello!" --out hello.mp3
    • Видео: mmx video generate --prompt "Ocean waves at sunset"
    • Музыка: mmx music generate --prompt "Upbeat pop" --lyrics "[verse] La da dee, sunny day"
  4. Используйте JSON-режим при необходимости: направляйте ввод (например, cat messages.json) в чат-команду и запрашивайте --output json.

Сценарии использования

  • Workflow агентов (кодинговые ассистенты): Добавьте этот CLI как «навык» к AI-агенту, чтобы агент мог вызывать команды вроде mmx text chat, mmx image или mmx video generate, следуя конвенциям агента.
  • Создание контента из терминала: Генерируйте изображения, речь или музыку из скриптов без отдельного UI (например, создание ассетов и сохранение в выходной путь).
  • Стриминг текстовых ответов для интерактивной работы: Используйте mmx text chat --stream для обработки инкрементального вывода в терминальных сессиях, чтобы наблюдать ответы по мере генерации.
  • Асинхронные медиа-конвейеры: Запустите задачу генерации видео с --async, затем получите и скачайте результаты позже с помощью mmx video task get --task-id ... и mmx video download --file-id ....
  • Трансформация медиа и каверы музыки: Генерируйте инструментальные треки или создавайте кавер-версии из референсного аудиофайла с помощью mmx music cover с --audio-file или --audio.

FAQ

  • Какие типы медиа может генерировать CLI? README перечисляет поддержку текста, изображений, видео, речи (TTS) и музыки, плюс vision (понимание/описание изображений) и веб-поиска.

  • Как аутентифицироваться? Используйте mmx auth login --api-key sk-xxxxx. CLI также предоставляет команды вроде mmx auth status, mmx auth refresh и mmx auth logout.

  • Можно ли использовать стриминг-вывод? Да. Текстовый чат включает опцию --stream, а синтез речи поддерживает режим --stream (пример направляет вывод в mpv -).

  • Как работать с JSON-выводом для чата/поиска? Примеры CLI показывают --output json для команд вроде текстового чата (включая направку сообщений из файла/STDIN) и поиска.

  • Есть ли поддержка Global и CN эндпоинтов? Проект отмечает «Seamless Global (api.minimax.io) и CN (api.minimaxi.com) support» и включает пример команды для установки региона в cn (mmx config set --key region --value cn).

Альтернативы

  • HTTP API-клиенты для MiniMax Platform: Если предпочитаете прямую интеграцию, вызывайте эндпоинты платформы из своих скриптов вместо этого CLI. Это даёт больше контроля, но требует обработки аутентификации и логики запросов.
  • Другие CLI «инструментов/навыков» для агентов: Многие AI-агенты поддерживают подключение инструментов/навыков; можно использовать другой коннектор инструментов для генерации медиа от агента. Разница в том, как инструмент представлен агенту и как вызываются команды.
  • Специализированные UI-генераторы медиа: Для неразработчиков браузерные инструменты упрощают взаимодействие от промпта к выводу. По сравнению с CLI они обычно обменивают автоматизацию и гибкость скриптинга на направленный интерфейс.

Альтернативы

紫东太初 icon

紫东太初

Новое поколение многомодальной большой модели, запущенной Институтом автоматизации Китайской академии наук и Уханьским институтом искусственного интеллекта, поддерживающей многократные вопросы и ответы, создание текста, генерацию изображений и комплексные задачи вопросов и ответов.

PXZ AI icon

PXZ AI

Все-в-одном AI платформа, которая объединяет инструменты для изображения, видео, голоса, письма и чата для повышения креативности и сотрудничества.

Slidesgo icon

Slidesgo

Бесплатные темы для Google Slides и шаблоны PowerPoint на Slidesgo: скачивайте, настраивайте онлайн и используйте для создания презентаций.

Grok AI Assistant icon

Grok AI Assistant

Grok — это бесплатный ИИ-помощник, разработанный xAI, который ставит во главу угла правдивость и объективность, предлагая расширенные возможности, такие как доступ к информации в реальном времени и генерация изображений.

AakarDev AI icon

AakarDev AI

AakarDev AI — это мощная платформа, которая упрощает разработку приложений ИИ с бесшовной интеграцией векторных баз данных, позволяя быстрое развертывание и масштабируемость.

Oli: Pregnancy Safety Scanner icon

Oli: Pregnancy Safety Scanner

Oli: Pregnancy Safety Scanner помогает проверять безопасность еды, косметики, добавок и других товаров во время беременности: сканируйте штрих‑код/фото и получайте оценку по триместру.