MiniMax-AI/cli
MiniMax-AI/cli — официальный CLI MiniMax AI Platform для генерации текста, изображений, видео, речи и музыки, а также vision и web search.
Что такое MiniMax-AI/cli?
MiniMax-AI/cli — официальный командный интерфейс (CLI) для MiniMax AI Platform. Он позволяет генерировать и обрабатывать различные типы медиа — текст, изображения, видео, речь и музыку — прямо из workflow агента, терминала или конвейера автоматизации.
CLI разработан для использования в средах агентов («из любого агента или терминала») и поддерживает глобальный и CN регионы через разные API-эндпоинты.
Ключевые возможности
- Мультимодальная генерация в одном CLI: Генерируйте текст, изображения, видео, речь (TTS) и музыку из командной строки и входных данных.
- Текстовый чат со стримингом и структурированным выводом: Поддерживает многотурный чат, стриминг, системные промпты и JSON-вывод с помощью команды
mmx text chat. - Управление генерацией изображений: Создавайте изображения с настройками соотношения сторон и пакетной генерацией (
--n), сохраняйте результаты в выходную директорию. - Асинхронная генерация видео с отслеживанием прогресса: Запускайте видео-задачи асинхронно (
--async) и позже скачивайте результаты по идентификаторам задач/файлов. - Синтез речи с голосом, скоростью и стримингом: Генерируйте TTS с 30+ голосами, регулируйте скорость и стримьте аудиовывод в медиаплеер.
- Возможности генерации музыки: Создавайте песни на основе текстов, генерируйте автотексты из промптов (
--lyrics-optimizer), создавайте инструментальные треки и кавера из референсного аудио. - Vision и поиск из командной строки: Используйте
mmx visionдля описания изображений иmmx searchдля веб-поиска, включая режим JSON-выводa. - Аутентификация и настройка региона: Вход с API-ключом и управление настройками региона (пример: установка региона в
cn).
Как использовать MiniMax-AI/cli
- Установите CLI.
- Для AI-агентов (OpenClaw, Cursor, Claude Code и т.д.): добавьте навык с помощью
npx skills add MiniMax-AI/cli -y -g. - Для терминала: установите глобально с
npm install -g mmx-cli.
- Для AI-агентов (OpenClaw, Cursor, Claude Code и т.д.): добавьте навык с помощью
- Аутентифицируйтесь с API-ключом вашего плана MiniMax token:
mmx auth login --api-key sk-xxxxx
- Запустите медиа-команду. Например:
- Текст:
mmx text chat --message "What is MiniMax?" - Изображение:
mmx image "A cat in a spacesuit" - Речь:
mmx speech synthesize --text "Hello!" --out hello.mp3 - Видео:
mmx video generate --prompt "Ocean waves at sunset" - Музыка:
mmx music generate --prompt "Upbeat pop" --lyrics "[verse] La da dee, sunny day"
- Текст:
- Используйте JSON-режим при необходимости: направляйте ввод (например,
cat messages.json) в чат-команду и запрашивайте--output json.
Сценарии использования
- Workflow агентов (кодинговые ассистенты): Добавьте этот CLI как «навык» к AI-агенту, чтобы агент мог вызывать команды вроде
mmx text chat,mmx imageилиmmx video generate, следуя конвенциям агента. - Создание контента из терминала: Генерируйте изображения, речь или музыку из скриптов без отдельного UI (например, создание ассетов и сохранение в выходной путь).
- Стриминг текстовых ответов для интерактивной работы: Используйте
mmx text chat --streamдля обработки инкрементального вывода в терминальных сессиях, чтобы наблюдать ответы по мере генерации. - Асинхронные медиа-конвейеры: Запустите задачу генерации видео с
--async, затем получите и скачайте результаты позже с помощьюmmx video task get --task-id ...иmmx video download --file-id .... - Трансформация медиа и каверы музыки: Генерируйте инструментальные треки или создавайте кавер-версии из референсного аудиофайла с помощью
mmx music coverс--audio-fileили--audio.
FAQ
-
Какие типы медиа может генерировать CLI? README перечисляет поддержку текста, изображений, видео, речи (TTS) и музыки, плюс vision (понимание/описание изображений) и веб-поиска.
-
Как аутентифицироваться? Используйте
mmx auth login --api-key sk-xxxxx. CLI также предоставляет команды вродеmmx auth status,mmx auth refreshиmmx auth logout. -
Можно ли использовать стриминг-вывод? Да. Текстовый чат включает опцию
--stream, а синтез речи поддерживает режим--stream(пример направляет вывод вmpv -). -
Как работать с JSON-выводом для чата/поиска? Примеры CLI показывают
--output jsonдля команд вроде текстового чата (включая направку сообщений из файла/STDIN) и поиска. -
Есть ли поддержка Global и CN эндпоинтов? Проект отмечает «Seamless Global (api.minimax.io) и CN (api.minimaxi.com) support» и включает пример команды для установки региона в
cn(mmx config set --key region --value cn).
Альтернативы
- HTTP API-клиенты для MiniMax Platform: Если предпочитаете прямую интеграцию, вызывайте эндпоинты платформы из своих скриптов вместо этого CLI. Это даёт больше контроля, но требует обработки аутентификации и логики запросов.
- Другие CLI «инструментов/навыков» для агентов: Многие AI-агенты поддерживают подключение инструментов/навыков; можно использовать другой коннектор инструментов для генерации медиа от агента. Разница в том, как инструмент представлен агенту и как вызываются команды.
- Специализированные UI-генераторы медиа: Для неразработчиков браузерные инструменты упрощают взаимодействие от промпта к выводу. По сравнению с CLI они обычно обменивают автоматизацию и гибкость скриптинга на направленный интерфейс.
Альтернативы
紫东太初
Новое поколение многомодальной большой модели, запущенной Институтом автоматизации Китайской академии наук и Уханьским институтом искусственного интеллекта, поддерживающей многократные вопросы и ответы, создание текста, генерацию изображений и комплексные задачи вопросов и ответов.
PXZ AI
Все-в-одном AI платформа, которая объединяет инструменты для изображения, видео, голоса, письма и чата для повышения креативности и сотрудничества.
Slidesgo
Бесплатные темы для Google Slides и шаблоны PowerPoint на Slidesgo: скачивайте, настраивайте онлайн и используйте для создания презентаций.
Grok AI Assistant
Grok — это бесплатный ИИ-помощник, разработанный xAI, который ставит во главу угла правдивость и объективность, предлагая расширенные возможности, такие как доступ к информации в реальном времени и генерация изображений.
AakarDev AI
AakarDev AI — это мощная платформа, которая упрощает разработку приложений ИИ с бесшовной интеграцией векторных баз данных, позволяя быстрое развертывание и масштабируемость.
Oli: Pregnancy Safety Scanner
Oli: Pregnancy Safety Scanner помогает проверять безопасность еды, косметики, добавок и других товаров во время беременности: сканируйте штрих‑код/фото и получайте оценку по триместру.